estadistica hoy

43
ESTADÍSTICA Estadística es una ciencia que utiliza datos numéricos para obtener inferencias basadas en el cálculo de probabilidades. Una estadística es también un conjunto de datos obtenidos a través de un estudio estadístico. Este término procede del alemán statistik (con un significado diferente al actual) y a su vez del latín statisticum collegium. Tipos de Estadística Se pueden establecer dos tipos de Estadística, dependiendo de si utilizan técnicas descriptivas o inferenciales. Estadística Descriptiva La Estadística Descriptiva se puede definir como el estudio que incluye la obtención, organización, presentación y descripción de información numérica. Su objetivo, por lo tanto, es decribir las características principales de los datos reunidos. Estadística Inferencial Por su parte, la Estadística Inferencial es el estudio que utiliza técnicas a partir de las cuales se obtienen generalizaciones o se toman decisiones en base a una información parcial o completa obtenida mediante técnicas descriptivas. Su objetivo es extraer conclusiones de utilidad sobre el total de las observaciones posibles basándose en la información obtenida. Probabilidad estadística La probabilidad estadística es una forma de medición de la certidumbre que asociada a la observación u ocurrencia de un fenómeno o al hecho de que una característica de un objeto de estudio adopte cierto valor. Se puede simplificar dividiendo el número de ocurrencias de un hecho entre el número total de casos posibles. Estadística aplicada La Estadística aplicada es la rama de la Estadística encargada de realizar inferencias a partir de una o varias muestras de una determinada población como objeto de estudio. La Estadística aplicada se utiliza en diversas ciencias, como la Historia, la Economía, la Educación o la Sociología para realizar estudios y análisis estadísticos.

Upload: carlos-alberto

Post on 11-Nov-2015

21 views

Category:

Documents


1 download

DESCRIPTION

estadística y probabilidad

TRANSCRIPT

ESTADSTICAEstadsticaes una ciencia que utiliza datos numricos para obtener inferencias basadas en el clculo de probabilidades. Una estadstica es tambin un conjunto de datos obtenidos a travs de un estudio estadstico.

Este trmino procede del alemn statistik(con un significado diferente al actual) y a su vez del latnstatisticum collegium.Tipos de EstadsticaSe pueden establecer dostiposde Estadstica,dependiendo de si utilizan tcnicasdescriptivas o inferenciales.Estadstica DescriptivaLaEstadstica Descriptivase puede definir como el estudio que incluye la obtencin,organizacin, presentacin y descripcin de informacin numrica. Su objetivo, por lo tanto, es decribir las caractersticas principales de los datos reunidos.Estadstica InferencialPor su parte, laEstadstica Inferenciales el estudio que utiliza tcnicas a partir de las cuales se obtienen generalizaciones o se toman decisiones en base a una informacin parcial o completa obtenida mediante tcnicas descriptivas. Su objetivo es extraer conclusiones de utilidad sobre el total de las observaciones posibles basndose en la informacin obtenida.Probabilidad estadsticaLaprobabilidad estadsticaes una forma de medicin de la certidumbre que asociada a la observacin u ocurrencia de un fenmeno o al hecho de que una caracterstica de un objeto de estudio adopte cierto valor. Se puede simplificar dividiendo el nmero de ocurrencias de un hecho entre el nmero total de casos posibles.Estadstica aplicadaLaEstadstica aplicadaes la rama de la Estadstica encargada de realizar inferencias a partir de una o varias muestras de una determinada poblacin como objeto de estudio. La Estadstica aplicada se utiliza en diversas ciencias, como la Historia, la Economa, la Educacin o la Sociologa para realizar estudios y anlisis estadsticos.Estadstica Paramtrica yEstadstica No ParamtricaLaEstadstica Paramtricaes un conjunto de tcnicas desarrolladas para niveles altos de medicin.LaEstadstica No Paramtricaes un conjunto de tcnicas diseadas para niveles menores de medicin menores.Poblacin estadsticaSe utiliza este trmino para referirse a un conjunto de personas, entidades u objetos sobre el que se pretende obtener cierta informacin para realizar algn tipo de anlisis.

ANTECEDENTES HISTRICOS DE LA ESTADSTICA:Los antecedentes de la estadstica aparecen en pocas antiguas. Uno de los antecedentes de la estadstica de los que se puede hacer constancia son los escritos sobre el historiador Tcito, al que el emperador Augusto le orden crear una encuesta y una especie de inventario de todos sus bienes, ya fuesen soldados, armamento, barcos entre otros.La ciencia de la estadstica aparece poco a poco mediante una evolucin histrica y que se puede constatar en los distintos escritos histricos de la humanidad. Siempre ha existido la necesidad de realizar recuentos, antes y despus de las guerras, de modo que se pueda visualizar de forma fcil la evolucin de un reino o la evolucin de un imperio.Otro antecedente de la estadstica surge en la isla italiana de Cerdea donde los primeros pobladores de esta isla, los llamados "Nuragas" levantaron bloques de piedra en los cuales realizaban escritos donde anotaban con mucha escrupulosidad los nmeros de ganado o de piezas cazadas de la poca. El trmino alemn statistik, que fue primeramente introducido por Gottfried Achenwall (1749), designaba originalmente el anlisis de datos del Estado, es decir, la "ciencia del Estado" (tambin llamada aritmtica poltica de su traduccin directa del ingls). No fue hasta el siglo XIX cuando el trmino estadstica adquiri el significado de recolectar y clasificar datos. Este concepto fue introducido por el ingls John Sinclair. En su origen, por tanto, la Estadstica estuvo asociada a los Estados, para ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La coleccin de datos acerca de estados y localidades contina ampliamente a travs de los servicios de estadsticas nacionales e internacionales. En particular, los censos suministran informacin regular acerca de la poblacin.Ya se utilizaban representaciones grficas y otras medidas en pieles, rocas, palos de madera y paredes de cuevas para controlar el nmero de personas, animales o ciertas mercancas. Hacia el ao 3000 a. C. los babilonios usaban ya pequeos envases moldeados de arcilla para recopilar datos sobre la produccin agrcola y de los gneros vendidos o cambiados. Los egipcios analizaban los datos de la poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XI a. C. Los libros bblicos de Nmeros y Crnicas incluyen en algunas partes trabajos de estadstica. El primero contiene dos censos de la poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas. En China existan registros numricos similares con anterioridad al ao 2000 a. C. Los antiguos griegos realizaban censos cuya informacin se utilizaba hacia el 594 a. C. para cobrar impuestos.Los mtodos estadstico-matemticos emergieron desde la teora de probabilidad, la cual data desde la correspondencia entre Pascal y Pierre de Fermat (1654). Christian Huygens (1657) da l primer tratamiento cientfico que se conoce a la materia. El Ars coniectandi (pstumo, 1713) de Jakob Bernoulli y la Doctrina de posibilidades (1718) de Abraham de Moivre estudiaron la materia como una rama de las matemticas. En la era moderna, el trabajo de Kolmogrov ha sido un pilar en la formulacin del modelo fundamental de la Teora de Probabilidades, el cual es usado a travs de la estadstica. La teora de errores se puede remontar a la pera miscellnea (pstuma, 1722) de Roger Cotes y al trabajo preparado por Thomas Simpson en 1755 (impreso en 1756) el cual aplica por primera vez la teora de la discusin de errores de observacin. La reimpresin (1757) de este trabajo incluye el axioma de que errores positivos y negativos son igualmente probables y que hay unos ciertos lmites asignables dentro de los cuales se encuentran todos los errores; se describen errores continuos y una curva de probabilidad.Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la combinacin de observaciones desde los principios de la teora de probabilidades. Laplace represent la ley de probabilidades de errores mediante una curva y dedujo una frmula para la media de tres observaciones. Tambin, en 1871, obtiene la frmula para la ley de facilidad del error (trmino introducido por Lagrange, 1744) pero con ecuaciones inmanejables. Daniel Bernoulli (1778) introduce el principio del mximo producto de las probabilidades de un sistema de errores concurrentes. El mtodo de mnimos cuadrados, el cual fue usado para minimizar los errores en mediciones, fue publicado independientemente por Adrien-Marie Legendre (1805), Robert Adrain (1808), y Carl Friedrich Gauss (1809). Gauss haba usado el mtodo en su famosa prediccin de la localizacin del planeta enano Ceres en 1801. Pruebas adicionales fueron escritas por Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W.F. Donkin (1844, 1856), John Herschel (1850) y Morgan Crofton (1870). Otros contribuidores fueron Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). La frmula de Peters para r, el probable error de una observacin simple es bien conocido. El siglo XIX incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion y Karl Pearson. Augustus De Morgan y George Boole mejoraron la presentacin de la teora. Adolphe Quetelet (1796-1874), fue otro importante fundador de la estadstica y quien introdujo la nocin del hombre promedio (lhomme moyen) como un medio de entender los fenmenos sociales complejos tales como tasas de criminalidad, tasas de matrimonio o tasas de suicidios.ESTADO ACTUALDurante el siglo XX, la creacin de instrumentos precisos para asuntos de salud pblica (epidemiologa, bioestadstica, etc.) y propsitos econmicos y sociales (tasa de desempleo, econometra, etc.) necesit de avances sustanciales en las prcticas estadsticas. Hoy el uso de la estadstica se ha extendido ms all de sus orgenes como un servicio al Estado o al gobierno. Personas y organizaciones usan la estadstica para entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y otras reas. La estadstica es entendida generalmente no como un sub-rea de las matemticas sino como una ciencia diferente aliada. Muchas universidades tienen departamentos acadmicos de matemticas y estadstica separadamente. La estadstica se ensea en departamentos tan diversos como psicologa, educacin y salud pblica.Al aplicar la estadstica a un problema cientfico, industrial o social, se comienza con un proceso o poblacin a ser estudiado. Esta puede ser la poblacin de un pas, de granos cristalizados en una roca o de bienes manufacturados por una fbrica en particular durante un periodo dado. Tambin podra ser un proceso observado en varios instantes y los datos recogidos de esta manera constituyen una serie de tiempo. Por razones prcticas, en lugar de compilar datos de una poblacin entera, usualmente se estudia un subconjunto seleccionado de la poblacin, llamado muestra. Datos acerca de la muestra son recogidos de manera observacional o experimental. Los datos son entonces analizados estadsticamente lo cual sigue dos propsitos: descripcin e inferencia. El concepto de correlacin es particularmente valioso. Anlisis estadsticos de un conjunto de datos puede revelar que dos variables (esto es, dos propiedades de la poblacin bajo consideracin) tienden a variar conjuntamente, como si hubiera una conexin entre ellas. Por ejemplo, un estudio del ingreso anual y la edad de muerte podra resultar en que personas pobres tienden a tener vidas ms cortas que personas de mayor ingreso. Las dos variables se dicen que estn correlacionadas. Sin embargo, no se puede inferir inmediatamente la existencia de una relacin de causalidad entre las dos variables. El fenmeno correlacionado podra ser la causa de una tercera, previamente no considerada, llamada variable confusora. Si la muestra es representativa de la poblacin, inferencias y conclusiones hechas en la muestra pueden ser extendidas a la poblacin completa. Un problema mayor es el de determinar que tan representativa es la muestra extrada. La estadstica ofrece medidas para estimar y corregir por aleatoriedad en la muestra y en el proceso de recoleccin de los datos, as como mtodos para disear experimentos robustos como primera medida, ver diseo experimental.El concepto matemtico fundamental empleado para entender la aleatoriedad es el de probabilidad. La estadstica matemtica (tambin llamada teora estadstica) es la rama de las matemticas aplicadas que usa la teora de probabilidades y el anlisis matemtico para examinar las bases tericas de la estadstica. El uso de cualquier mtodo estadstico es vlido solo cuando el sistema o poblacin bajo consideracin satisface los supuestos matemticos del mtodo. El mal uso de la estadstica puede producir serios errores en la descripcin e interpretacin, afectando las polticas sociales, la prctica mdica y la calidad de estructuras tales como puentes y plantas de reaccin nuclear.Incluso cuando la estadstica es correctamente aplicada, los resultados pueden ser difcilmente interpretados por un inexperto. Por ejemplo, el significado estadstico de una tendencia en los datos, que mide el grado al cual la tendencia puede ser causada por una variacin aleatoria en la muestra, puede no estar de acuerdo con el sentido intuitivo. El conjunto de habilidades estadsticas bsicas (y el escepticismo) que una persona necesita para manejar informacin en el da a da se refiere como cultura estadsticaLos antecedentes de la estadstica aparecen en pocas antiguas. Uno de los antecedentes de la estadstica de los que se puede hacer constancia son los escritos sobre el historiador Tcito, al que el emperador Augusto le orden crear una encuesta y una especie de inventario de todos sus bienes, ya fuesen soldados, armamento, barcos entre otros. La ciencia de la estadstica aparece poco a poco mediante una evolucin histrica y que se puede constatar en los distintos escritos histricos de la humanidad. Siempre ha existido la necesidad de realizar recuentos, antes y despus de las guerras, de modo que se pueda visualizar de forma fcil la evolucin de un reino o la evolucin de un imperio. Otro antecedente de la estadstica surge en la isla italiana de Cerdea donde los primeros pobladores de esta isla, los llamados "Nuragas" levantaron bloques de piedra en los cuales realizaban escritos donde anotaban con mucha escrupulosidad los nmeros de ganado o de piezas cazadas de la poca.

MANEJO DE LA INFORMACIN

En general las fuentes de informacin estadstica son las particularidades de los procesos o fenmenos:calidad. concepcin,eficacia,eficienciau otros atributos que den cuenta de su modo de ejecucin; as como los participantes directos, de aquellos procesos o fenmenos acerca de los cuales se necesita recopilar informacin: las personas, sus opiniones, sus planteamientos, sus formas de vida , la labor que realizan, sus apreciaciones , sus estados de nimo, actos y acerca de la realidad circundante.

En el desarrollo de las investigaciones cientficas resulta muy necesario obtener informacin teniendo en cuenta el problema a investigar, el objeto de la investigacin y los mtodos que se empleen para el desarrollo del trabajo. En la bsqueda de tal informacin es de vital importancia un adecuado manejo de las Fuentes de informacin estadstica, concebido como el proceso que permite obtener la informacin contenida en las fuentes que la portan, en forma de datos.Este proceso indagativo est presente durante todo el desarrollo de un trabajo cientfico, sin embargo la bsqueda y manejo de la informacin estadstica se hace necesaria en la realizacin deldiagnsticoinicial, la caracterizacin del estado inicial del objeto y en la etapa de corroboracin de la validez de lahiptesis.

Este tipo de indagacin est relacionado con el empleo de los procedimientos empricos, para medirvariablesque en general estn relacionadas con conceptos, oteorasen las que resulta relevante elcomportamientode determinados procesos o sujetos que intervienen como actores de estos procesos. "Medir es el proceso de vincular conceptos abstractos con indicadores empricos, mediante clasificacin y/o cuantificacin [.] como lo fundamenta Roberto Hernandez Sampieri, queesamedicines efectiva cuando el instrumento de recoleccin de los datos realmente representa a las variables que tenemos en mente, por ende, para recolectar los datos se requieren dar tres pasos:

Seleccionar o elaborar un instrumento de recoleccin de los datos, aplicar ese instrumento de medicin. Es decir, obtener las observaciones y mediciones de las variables que son deinterspara nuestro estudio (medir variables) y preparar las mediciones obtenidas para que puedan analizarse correctamente (a esta actividad se le denomina codificacin de los datos). Las variables a medir pueden ser cualitativas o cuantitativas, por cuanto son expresin de cualidades, caractersticas, atributos, comportamiento o condicin de objetos o sujetos y dicha medicin requiere de la aplicacin de instrumentos diseados a tal efecto, los cuales estn concebidos en la Metodologa de la Investigacin Cientfica y estn relacionados con mtodos y tcnicas como el censo, laencuestayla entrevista.

Segn los fundamentos del colectivo de autores del presente manuscrito, en dependencia del fenmeno o proceso que se desee investigar se utilizan diferentes instrumentos para acceder a estas fuentes, entre ellos tenemos la observacin, el censo, la encuesta y laentrevista. Para la elaboracin de estos instrumentos se requiere tener en cuenta las variables o caractersticas a medir y dentro de ellas los indicadores, que a veces se desglosan en subindicadores. Este proceder permite definir hacia donde va dirigida la indagacin, es decir aquellos aspectos a considerar en la medicin a realizar. La delimitacin de los indicadores depende del inters del investigador al observar un proceso y de sus supuestos tericos, que son los que determinan los aspectos a tomar en cuenta en la forma de definirlos. Cuando eso sucede, hay que considerar tambin si lo que se desea medir es la forma en que se ejecuta el proceso o las caractersticas o cualidades de los actores del proceso.

Por ejemplo en una investigacin sobre laenseanzade la Estadstica se quiere determinar el nivel de preparacin que tienen los estudiantes para resolverproblemasprofesionales relacionados. Elprofesorles orienta una tarea que consiste en resolver este tipo de problemas y observa el resultado de la actividad de los estudiantes, pero lo hace empleando los indicadores a partir de las habilidades que considera deben demostrar estos para realizar la tarea orientada, y dentro de los indicadores, define subindicadores que expresan habilidades ms especficas a desarrollar para llegar a las antes mencionadas.

MUESTREO (ESTADSTICA)Enestadsticase conoce comomuestreoa la tcnica para la seleccin de unamuestraa partir de unapoblacin.Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a lapoblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzaran si se realizase un estudio de toda la poblacin.Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la poblacin sino estimar tambin los mrgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea unamuestra representativa, pero s podemos actuar de manera que esta condicin se alcance con una probabilidad alta.En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se puede extraer dos o ms muestras de la misma poblacin. Al conjunto de muestras que se pueden obtener de la poblacin se denominaespacio muestral. La variable que asocia a cada muestra su probabilidad de extraccin, sigue la llamadadistribucin muestral.Tcnicas de muestreo estadsticoExisten dos mtodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso en el proceso de seleccin). Cuando este ltimo cumple con la condicin de que todos los elementos de la poblacin tienen alguna oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada sujeto de la poblacin es conocida de antemano, recibe el nombre demuestreo probabilstico. Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir cmo tomar una muestra aleatoria ms adelante.Muestreo ProbabilsticoForman parte de este tipo de muestreo todos aquellos mtodos para los que se puede calcular la probabilidad de extraccin de cualquiera de las muestras posibles. Este conjunto de tcnicas de muestreo es el ms aconsejable, aunque en ocasiones no es posible optar por l. En este caso se habla de muestras probabilistas, pues no es correcto hablar en rigor de muestras representativasdado que, al no conocer las caractersticas de la poblacin, no es posible tener certeza de que tal caracterstica se haya conseguido.

TiposSin reposicin de los elementos:'Cada elemento extrado se descarta para la subsiguiente extraccin. Por ejemplo, si se extrae una muestra de una "poblacin" de bombillas para estimar la vida media de las bombillas que la integran, no ser posible medir ms que una vez la bombilla seleccionada.Con reposicin de los elementos:Las observaciones se realizan con remplazo de los individuos, de forma que la poblacin es idntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extraccin es tan pequea que el muestreo puede considerarse con reposicin aunque, realmente, no lo sea.Con reposicin mltiple:En poblaciones muy grandes, la probabilidad de repetir una extraccin es tan pequea que el muestreo puede considerarse con reposicin.Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la extraccin denmeros aleatoriosmediante ordenadores, calculadoras o tablas construidas al efecto.Muestreo sistemticoSe utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevacin: K= N/nDondeNes el tamao del universo ynel tamao de la muestra.

Para determinar en qu fecha se producir la primera extraccin, hay que elegir al azar un nmero entre 1 y K; de ah en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenmeno.Esto quiere decir que si tenemos un determinado nmero de personas que es la poblacin (N) y queremos escoger de esa poblacin un nmero ms pequeo el cual es la muestra (n), dividimos el nmero de la poblacin por el nmero de la muestra que queremos tomar y el resultado de esta operacin ser el intervalo, entonces escogemos un nmero al azar desde uno hasta el nmero del intervalo, y a partir de este nmero escogemos los dems siguiendo el orden.Muestreo estratificadoConsiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo que compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms usadas en la prctica.Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos tcnicas de muestreo estratificado: Asignacin proporcional:el tamao de la muestra dentro de cada estrato es proporcional al tamao del estrato dentro de la poblacin. Asignacin ptima:la muestra recoger ms individuos de aquellos estratos que tengan ms variabilidad. Para ello es necesario un conocimiento previo de la poblacin.Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. En la asignacin proporcional, si la poblacin est compuesta de un 55% de mujeres y un 45% de hombres, se tomara una muestra que contenga tambin esos mismos porcentajes de hombres y mujeres. En la asignacin ptima, si todos los hombres piensan igual, pero las mujeres son impredecibles, se tomara una muestra con ms del 55% de mujeres.Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados con este procedimiento, suponemos que la poblacin est dividida enhsubpoblaciones o estratos de tamaos conocidos N1, N2,..., Nhtal que las unidades en cada estrato sean homogneas respecto a la caracterstica en cuestin. La media y la varianza desconocidas para eli-simo estrato son denotadas pormiysi2, respectivamente.MUESTREO POR ETAPAS MLTIPLESEsta tcnica es la nica opcin cuando no se dispone de lista completa de la poblacin de referencia o bien cuando por medio de la tcnica de muestreo simple o estratificado se obtiene una muestra con unidades distribuidas de tal forma que resultan de difcil acceso. En el muestreo a estadios mltiples se subdivide la poblacin en varios niveles ordenados que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla en varias fases o extracciones sucesivas para cada nivel.Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un pas determinado, stos pueden subdividirse en unidades primarias representadas por circunscripciones didcticas y unidades secundarias que seran los propios profesores. En primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de cada una de las primarias seleccionadas en la primera extraccin.MUESTREO POR CONGLOMERADOSSe utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que se supone que contienen toda la variabilidad de la poblacin, es decir, la representan fielmente respecto a la caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos oconglomeradospara la realizacin del estudio.Dentro de los grupos seleccionados se ubicarn las unidades elementales, por ejemplo, las personas a encuestar, y podra aplicrsele el instrumento de medicin a todas las unidades, es decir, los miembros del grupo, o slo se le podra aplicar a algunos de ellos, seleccionados al azar. Este mtodo tiene la ventaja desimplificarla recogida de informacin muestral.Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la muestra, el diseo se llamamuestreo bietpico.Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer mtodo funciona mejor cuanto ms homognea es la poblacin respecto del estrato, aunque ms diferentes son stos entre s. En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre s.Homogeneidad de las poblaciones o sus subgruposHomogneosignifica, en el contexto de la estratificacin, que no hay mucha variabilidad. Los estratos funcionan mejor cuanto ms homogneos son cada uno de ellos respecto a la caracterstica a medir. Por ejemplo, si se estudia la estatura de una poblacin, es bueno distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya menos variabilidad, es decir, sean menos heterogneos. Dicho de otro modo, no hay tantas diferencias entre unas estaturas y otras dentro del estrato que en la poblacin total.Por el contrario, la heterogeneidad hace intil la divisin en estratos. Si se dan las mismas diferencias dentro del estrato que en toda la poblacin, no hay por qu usar este mtodo de muestreo. En los casos en los que existan grupos que contengan toda la variabilidad de la poblacin, lo que se construyen son conglomerados, que ahorran algo del trabajo que supondra analizar toda la poblacin. En resumen, los estratos y los conglomerados funcionan bajo principios opuestos: los primeros son mejores cuanto ms homogneo es el grupo respecto a la caracterstica a estudiar y los conglomerados, si representan fielmente a la poblacin, esto es, contienen toda su variabilidad, o sea, son heterogneos.Muestreo no probabilsticoEs aqul para el que no se puede calcular la probabilidad de extraccin de una determinada muestra. Por tal motivo, se busca seleccionar a individuos que tienen un conocimiento profundo del tema bajo estudio y se considera que la informacin aportada por esas personas es vital para la toma de decisiones.Muestreo por cuotasEs la tcnica ms difundida sobre todo en estudios de mercado y sondeos de opinin. En primer lugar es necesario dividir la poblacin de referencia en varios estratos definidos por algunas variables de distribucin conocida (como el gnero o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte proporcional de poblacin que representan. Finalmente se multiplica cada peso por el tamao dende la muestra para determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado en que una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato.Muestreo de bola de nieveIndicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en contacto entre s. Consiste en identificar sujetos que se incluirn en la muestra a partir de los propios entrevistados. Partiendo de una pequea cantidad de individuos que cumplen los requisitos necesarios, servirn como localizadores de otros con caractersticas anlogas.Muestreo subjetivo por decisin razonadaEn este caso las unidades de la muestra se eligen en funcin de algunas de sus caractersticas de manera racional y no casual. Una variante de esta tcnica es elmuestreo compensado o equilibrado, en el que se seleccionan las unidades de tal forma que la media de la muestra para determinadas variables se acerque a la media de la poblacin. La cual funciona en base a referencias o por recomendacin despus se reconoce por medio de la estadstica.

FRECUENCIASLa distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.FRECUENCIA ABSOLUTAEs el promedio de una suma predeterminada y adems consiste en saber cul es el nmero o smbolo de mayor equivalencia. (ni) de una variable estadstica Xi, es el nmero de veces que este valor aparece en el estudio. A mayor tamao de la muestra aumentar el tamao de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N).FRECUENCIA RELATIVA (FI)Es el cociente entre la frecuencia absoluta y el tamao de la muestra (N). Es decir,

Siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribucin de frecuencias.Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi)FRECUENCIA ABSOLUTA ACUMULADA (Ni)Es el nmero de veces ni en la muestra N.FRECUENCIA RELATIVA ACUMULADA (Fi)Es el cociente entre la frecuencia absoluta acumulada y el total de la muestra.

EJEMPLO DE FRECUENCIASupongamos que las calificaciones de un alumno de secundaria fueran las siguientes:18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13. Entonces:La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.La frecuencia relativa de 11 es 0.17, porque corresponde a la divisin 3/18 ( 3 de las veces que aparece de las 18 notas que aparecen en total).

DISTRIBUCIN DE FRECUENCIAS

La distribucin de frecuencias es una tabla que divide un conjunto de datos en un numero de clases (categoras) apropiadas, mostrando tambin el nmero de elementos en cada clase. La tabla sacrifica parte de la informacin contenida en los datos; En lugar de conocer el valor exacto de cada elemento. Solo sabemos que pertenece a una clase determinada. Por otra parte, ese tipo de agrupamiento hace resaltar caractersticas importantes en los datos, y en lo que se gana en legibilidad, compensa con creces la perdida de informacin. A continuacin consideraremos principalmente las distribuciones numricas, es decir, distribuciones de frecuencias donde los datos se hallan agrupados por su tamao: si se hallan agrupados de acuerdo con alguna cualidad o atributo denominaremos distribucin categrica a esa distribucin.La primera etapa la construccin de una distribucin de frecuencias consiste en decir en cuantas clases utilizar y elegir los lmites de cada clase, es decir, de donde a donde abarca cada una. En general, el nmero de clases que usemos depende del nmero de observaciones, pero tiene muy poca utilidad utilizar menos de 5 o ms de 15. Depende de s mismo del rango de los datos, es decir, la diferencia entre la observacin ms grande y la ms pequea.Para ejemplificar la construccin de una distribucin de distribucin de frecuencia, consideramos la siguientes mediciones de la emisin diaria (en toneladas) de xido de azufre de una planta industrial. 10.5 1526.4 17.3 11.2 23.9 24.8 18.7 13.9 9.0 13.222.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 23.7 22.7 18.0 20.5 11.0 20.9 15.5 19.4 16.7 10.7 15.2 22.9 26.6 20.4 21.4 19.2 21.6 16.9 19.018.5 23.0 24.6 20.1 16.2 18.0 7.7 13.5 23.5 14.514.4 29.6 19.4 17.0 20.8 24.3 22.5 24.6 18.4 18.1 21.9 12.3 22.3 13.3 11.8 19.3 20.0 25.7 31.8 25.9.9 27.5 18.1 17.9 9.4 24.1 20.1 18.5En vista de que las observacin ms grande es 31.8, y la ms pequea es 6.2 y el rango es 25.6, podramos elegir seis clases que tuvieran los limites 5.0-.9.9,10.0-14.9,...,30.0-34.9. Podramos tambin elegir las siete clases 5.o-8.9, 9.0-12.9,..., 29.0-31.9. Ntese que en cada caso las clases no se traslapan, incluyen todos los datos y tienen la misma medida.Supngase que hemos optado por la segunda de estas clasificaciones; ordenamos las 80 observaciones y obtenemos los resultados que se muestran en la siguiente tabla:Lmites de clase Etiqueta Frecuencia5.0-8.9 /// 39.0-12.9 //// //// 1013.0-16.9 //// //// //// 1417.0-20.9 //// //// //// //// //// 2521.0-24.9 //// //// //// // 1725.0-28.9 //// //// 929.0-32.9 // 2Total 80Obsrvese que los lmites de clase se dan con el mismo nmero de decimales que los datos originales. Si los datos se hubiesen dado con dos decimales, habramos usado los lmites de clase 5.00-8.99, 9.00-12.99,..., 29.0-32.99 y, de haber sido redondeados al entero ms prximo, se habran utilizado los lmites de clase 5-8, 9-12,..., 29-32.Como sealamos anteriormente, una vez que lo datos han sido agrupados, cada observacin pierde su identidad en el sentido de que su valor exacto ya no se conoce. Esto puede originar dificultades cuando queremos dar algunas descripciones ulteriores de los datos, pero podemos evitarlas representando cada observacin en una clase por su punto medio, denominando marca de clase. En general, las marcas de clase de una distribucin de frecuencias se obtiene promediando los lmites de clase consecutivos o fronteras de clases sucesivas. Si todas las clases de una distribucin tienen la misma longitud, como en nuestro ejemplo, al intervalo comn entre cuales quiera marcas d clase sucesivas lo llamaremos intervalo de clase de la distribucin. Ntese que el intervalo puede obtenerse tambin en la diferencia entre dos fronteras cualquiera de clase consecutivas, pero no de la diferencia entre los lmites de clases sucesivos.Ejemplo:En relacin con el ejemplo de la distribucin de los datos de xido de azufre, indquese, a) Las marcas de clase y b) el intervalo de clase.a) Las marcas de clase son 5.0+8.9=6.95 9.0+ 12.9= 10.95, 14.95,18.95,22.95, 26.95 y 30.95. b) El intervalo de clase es: 10.95 - 6.95 =4.Existen varias formas alternas de agrupar los datos. Entre estas se encuentran las distribuciones acumuladas menor que o menor, mayor que y o mayor. Una distribucin acumulada menor que muestra el nmero total de observaciones que son menores que los valores dados. Esto deben ser fronteras de clase o lmites de clase apropiados, pero no pueden ser marcas de clase.Ejemplo convirtase la distribucin de la emisin del xido de azufre en una distribucin que muestre cuantas observaciones son menores que 4.95, menores que 8.95, menores que 12.95, ..., y menor que 3.95.Como ninguno de los valores es menor que 4.95., menores que 8.95, 3+ 10 =13 son menores que 12.95, 3-10+ 14 =7 son menores que 16.95, y los 80 valores son menores que 32.95.Las distribuciones acumuladas mayor que y o mayor se construyen, de manera similar, sumando las frecuencias una por una empezando en el otro extremo de la distribucin de la frecuencia. En la prctica, las distribuciones acumuladas menor que se utilizan con mayor frecuencia, y es bastante comn referirse a ellas simplemente como distribuciones acumuladas.Si se desea comparar distribuciones de frecuencias, puede ser necesario (o al menos ventajoso), convertidas en distribuciones porcentuales. Basta dividir cada frecuencia de clase entre la frecuencia total (el nmero total de observaciones en la distribucin), y multiplicar por cien; en esta forma se indica que porcentaje de los datos esta en cada clase de la distribucin puede hacerse lo mismo tambin con las distribuciones acumuladas, convirtindolas as en distribuciones porcentuales acumuladas.

REPRESENTACIN GRAFICA E INTERPRETACIN Grfica o grfico son las denominaciones de la representacin de datos, generalmente numricos, mediante recursos grficos (lneas, vectores, superficies o smbolos), para que se manifieste visualmente la relacin que guardan entre s.

EXISTEN DIFERENTES TIPOS DE GRFICAS, QUE SE PUEDEN CLASIFICAR EN:GRFICO LINEAL Se representan los valores en dos ejes cartesianos ortogonales entre s. Las grficas lineales se recomiendan para representar series en el tiempo, y es donde se muestran valores mximos y mnimos; tambin se utilizan para varias muestras en un diagrama.

GRFICO DE BARRASSe usa cuando se pretende resaltar la representacin de porcentajes de datos que componen un total. Una grfica de barras contiene barras verticales que representan valores numricos, generalmente usando una hoja de clculo. Las grficas de barras son una manera de representar frecuencias; las frecuencias estn asociadas con categoras. Una grfica de barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de largo (alto si es horizontal) igual a la frecuencia. La grfica de barras sirve para comparar y tener una representacin grfica de la diferencia de frecuencias o de intensidad de la caracterstica numrica de inters. Ver archivo Adjunto

HISTOGRAMASe emplea para ilustrar muestras agrupadas en intervalos. Est formado por rectngulos unidos a otros, cuyos vrtices de la base coinciden con los lmites de los intervalos y el centro de cada intervalo es la marca de clase que representamos en el eje de las abscisas. La altura de cada rectngulo es proporcional a la frecuencia del intervalo respectivo.

GRFICO CIRCULARPermite ver la distribucin interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, segn lo que se desee destacar.

PICTOGRAMACon imgenes que sirven para representar el comportamiento o la distribucin de los datos cuantitativos de una poblacin, utilizando smbolos de tamao proporcional al dato representado. Una posibilidad es que el grfico sea analgico por ejemplo, la representacin de los resultados de las elecciones con colores sobre un hemiciclo.

BIBLIOGRAFA: PAGINAS CONSULTADAS

http://es.wikipedia.org/wiki/Muestreo_%28estad%C3%ADstica%29http://html.rincondelvago.com/estadistica_51.htmlhttp://www.monografias.com/trabajos73/estadistica-descriptiva/estadistica-descriptiva3.shtml

MEDIDAS DE TENDENCIA CENTRAL

DEFINICIONES:Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos ordenados segn su magnitud. Generalmente se utilizan 4 de estos valores tambin conocidos como estadigrafos, la media aritmtica, la mediana, la moda y al rango medio. La media aritmtica es la medida de posicin utilizada con ms frecuencia. Si se tienen n valores de observaciones, la media aritmtica es la suma de todos y cada uno de los valores dividida entre el total de valores: Lo que indica que puede ser afectada por los valores extremos, por lo que puede dar una imagen distorsionada de la informacin de los datos.La Mediana, es el valor que ocupa la posicin central en un conjunto de datos, que deben estar ordenados, de esta manera la mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen observaciones extremas. La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores extremos, pero es ms variables que la media y la mediana.Rango Medio es la media de las observaciones menor y mayor. Como intervienen solamente estas observaciones, si hay valores extremos, se distorsiona como medida de posicin, pero ofrece un valor adecuado, rpido y sencillo para resumir al conjunto de datos. MEDIA ARITMTICALa medida de tendencia central ms ampliamente usada es la media aritmtica, usualmente abreviada como la media y denotada por (lase como "X barra"). La media aritmtica para datos no agrupadosSi se dispone de un conjunto de n nmeros, tales como X1, X2, X3,,Xn, la media aritmtica de este conjunto de datos se define como "la suma de los valores de los ni nmeros , divididos entre n", lo que usando los smbolos explicados anteriormente , puede escribirse como:

EJEMPLO:Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 27,34 y 25., para calcular la media aritmtica (promedio de las edades, se tiene que:

La media aritmtica para datos agrupadosSi los datos se presentan en una tabla de distribucin de frecuencias, no es posible conocer los valores individuales de cada una de las observaciones, pero si las categoras en las cuales se hallan. Para poder calcular la media, se supondr que dentro de cada categora, las observaciones se distribuyen uniformemente dentro alrededor del punto medio de la clase, por lo tanto puede considerarse que todas las observaciones dentro de la clase ocurren en el punto medio, por lo expuesto la media aritmtica para datos agrupados puede definirse de la siguiente manera:Si en una tabla de distribucin de frecuencia, con r clases, los puntos medio son: X1, X2, X3,,Xn; y las respectivas frecuencias son f1, f2, f3, , fn, la media aritmtica se calcula de la siguiente manera:

donde: N = nmero total de observaciones, por tanto fi puede simplificarse y escribirse como N ( N= fi )EJEMPLO:Si se toman los datos del ejemplo resuelto al construir la tabla de distribucin de frecuencia de las cuentas por cobrar de Cabreras y Asociados que fueron los siguientes:Clases 1 2 3 4 5 6Puntos Medios (Xi) 14,628 29,043 43.458 57,873 72.288 86.703Frecuencias (fi) 10 4 5 3 3 5Al calcular la cuenta promedio por cobrar (media aritmtica) de estos datos se tiene lo siguiente:

Media aritmtica ponderadaPor otro lado, si al promediar los datos estos tienen diferentes pesos, entonces estamos ante un caso de media aritmtica ponderada, que puede definirse de la siguiente maneraDEFINICIN:Sea dado un conjunto de observaciones, tales como X1, X2; X3; ; Xn; y un conjunto de valores p1, p2; p3; ; pn; asociado con cada observacin Xi respectivamente, que reciben el nombre de factores de ponderacin, entonces la media ponderada se calcula como:

MEDIANALa mediana es una medida de posicin y se define como la posicin central en el arreglo ordenado de la siguiente manera:Dado un conjunto de nmeros agrupados en orden creciente de magnitud, la mediana es el nmero colocado en el centro del arreglo, de tal forma que una mitad de las observaciones est por encima y la otra por debajo de dicho valor. Si el nmero de observaciones es par, la mediana es la media de los dos valores que se hallan en el medio del arreglo, de donde se concluye en la siguiente definicin:Mediana. Es el punto medio de los valores de una serie de datos despus de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos La mediana para datos agrupadosSi se tiene una distribucin de frecuencias, la mediana es igualmente ese valor que tiene 50% de las observaciones por debajo y 50 % por encima. Geomtricamente, la mediana es el valor de X sobre el eje de las abscisas correspondiente a la ordenada que divide un histograma en dos partes de igual rea.Para hallar el valor de la mediana, en el caso de datos agrupados debe encontrarse primero la clase mediana, la que se define como la clase ms baja para la cual la frecuencia acumulada excede N/2 (siendo N=fi ). Encontrada esta clase, la siguiente formula servir para hallar el valor de la medianaN/2 faX0.5 = Li + ------------- ( C )fi

DONDE:L = lmite inferior de la clase mediana.N = frecuencia total o fi.fa = frecuencia absoluta acumulada hasta la clase premedianafi = frecuencia absoluta de la clase medianaC = amplitud de la clase mediana.

MODAA veces es importante conocer cul es el valor que ms prevalece en el conjunto de datos. El valor que ocurre con ms frecuencia se le conoce como moda. La moda es la medida de tendencia central especialmente til para describir mediciones de tipo ordinal, de intervalos y nominal.En un conjunto de nmeros la moda se define como el valor nmero que ocurre con ms frecuenciaEjemplo:En el siguiente conjunto de nmeros 1, 5, 5, 9, 12, 12, 12, 14. La moda es igual a 12, por cuanto que es el nmero que ms se repite (tres veces) LA MODA PARA DATOS AGRUPADOS (MO.):La Moda puede deducirse de una distribucin de frecuencia o de un histograma a partir de la frmula.Mo. = Li + [ ( 1 / 1+2 ) ] CDonde;Li = lmite inferior de la clase modal (clase de mayor frecuencia absoluta (fa)1 = diferencia de las frecuencias absolutas de la clase modal y premodal.2 = diferencia de las frecuencias absolutas de la clase modal y postmodalC = amplitud de la clase modal.

Propiedades de la moda La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de intervalos, y relativa). La moda tiene la ventaja de no ser afectada por valores extremos. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos. Desventajas de la moda En muchas series de datos no hay moda porque ningn valor aparece ms de una vez. En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse cual es el valor representativo de la serie de datos?

MEDIA GEOMTRICAEs la raz de ndice de la frecuencia total cuyo radicando es el producto de las potencias de cada valor de la variable elevado a sus respectivas frecuencias absolutas, se denota por g; suele utilizarse cuando los valores de la variable siguen una progresin geomtrica. Tambin para promediar porcentajes, tasas, n ndices, etc. siempre que nos vengan dados en porcentajes y se calcula mediante la siguiente frmula como la que se muestra a bajo:g = n(X1 * X2 * * XnFrmula que algunas veces es conveniente expresarla en forma logartmica. El logaritmo de la media geomtrica es la media aritmtica de los logaritmos de los valores de la variable. El problema se presenta cuando algn valor es 0 negativo y exponente de la raz par ya que no exista raz par de un nmero negativo, entonces la frmula anterior se presenta de la siguiente manera:log Xg = 1/N (log X1 + log X2 + + log Xn)Respuesta: la media geomtrica de los datos es 4 Propiedades de la media geomtrica (g) La media geomtrica esta basada en todas las observaciones, por lo que est afectada por todos los valores de la variable. Sin embargo, da menos pesos a los valores extremadamente grandes que el que les da la media aritmtica. La media geomtrica es igual a cero si algunos de los valores es cero, y se puede volver imaginaria si ocurren valores negativos. Con la excepcin de estos dos casos, su valor siempre es definitivo y est rgidamente definido. La media geomtrica es la que se debe utilizar cuando lo que se va a promediar son tasas de cambios o proporciones, y se intenta dar igual peso a tasas de cambios iguales.

MEDIA ARMNICAMedia Armnica, la representaremos como a, es la inversa de la media aritmtica de las inversas de los valores de la variable, responde a la siguiente definicin:Si se tiene un conjunto de observaciones tales como: X1, X2, . Xn; la media armnica, denotada por a, se define como el reciproco de la suma de los valores inversos de la variable estadstica divididos entre el nmero total de datos y se calcula con la siguiente frmula

EJEMPLO:Un automvil que hace viajes de ida y vuelta entre las ciudades A y B, realiza el viaje entre A y B a razn de 80 Km por hora y el viaje entre B y A a 120 Km por hora, La velocidad promedio del viaje de ida y vuelta ser dea = (1/80 + 1/120)/2 = [(120+80)9600]/2 = 19200/200 = 96 km/hPropiedades de la media armnica La media armnica se basa en todas las observaciones por lo que est afectada por todos los valores de la variable. Da a los valores extremadamente grandes un peso menor que el que les da la media geomtrica, mientras que a los valores pequeos les da un peso mayor que el que les da tanto la media aritmtica como la media geomtrica. La media armnica esta indeterminada si alguno de los valores es cero, pues hallar el recproco de cero implica dividir entre cero, lo cual no es vlido. La media armnica est rgidamente definida y siempre es definitiva, excepto cuando uno de los valores es cero. La media armnica es el promedio que se ha de usar, cuando lo que se va a promediar son proporciones donde los numeradores de las razones son los mismos para todas las proporciones.

BIBLIOGRAFA: PAGINAS CONSULTADAS

http://www.monografias.com/trabajos43/medidas-tendencia-central/medidas-tendencia-central2.shtml#ixzz3EBv8qyXxhttps://sites.google.com/site/estadisticadm/b-organizacion-y-presentacon-de-datos/b-3-medidas-de-tendencia-central http://fcps.uaq.mx/descargas/prope2014/estadistica/3/tendencia_central_14.pdf

MEDIDAS DE DISPERSIN.Medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos.Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviacin media) y otra es tomando las desviaciones al cuadrado (varianza).RANGO ESTADSTICO Recorrido estadstico al intervalo entre el valor mximo y el valor mnimo; por ello, comparte unidades c En estadstica descriptiva se denomina rango estadstico (R) on los datos. Permite obtener una idea de la dispersin de los datos, cuanto mayor es el rango, ms dispersos estn los datos de un conjunto.Por ejemplo, para una serie de datos de carcter cuantitativo, como lo es la estatura medida en centmetros, tendramos:

es posible ordenar los datos como sigue:

donde la notacin x(i) indica que se trata del elemento i-simo de la serie de datos. De este modo, el rango sera la diferencia entre el valor mximo (k) y el mnimo; o, lo que es lo mismo:

En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30El rango o recorrido estadstico es la diferencia entre el valor mximo y el valor mnimo en un grupo de nmeros aleatorios. Se le suele simbolizar con R.

REQUISITOS DEL RANGOOrdenamos los nmeros segn su tamao.Restamos el valor mnimo del valor mximo

Ejemplo Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus valores se encuentran en un rango de:

MEDIO RANGO O RANGO MEDIOEl medio rango o rango medio de un conjunto de valores numricos es la media del mayor y menor valor, o la tercera parte del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia, el medio rango es:

EJEMPLOPara una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolvindolo mediante la correspondiente frmula sera:

REPRESENTACIN DEL MEDIO RANGO: Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia entre el valor ms alto (Xn Xmax.) y el mas bajo (X1 Xmin) en un conjunto de datos.Rango para datos no agrupados;R = Xmx.-Xmn = Xn-X1Ejemplo:Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 27,34 y 25., para calcular la media aritmtica (promedio de las edades, se tiene que:R = Xn-X1 ) = 34-18 = 16 aosCon datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los lmites de clases. Se aproxima el rango tomando el limite superior de la ltima clase menos el limite inferior de la primera clase.Rango para datos agrupados;R= (lim. Sup. de la clase n lim. Inf. De la clase 1)Ejemplo:Si se toman los datos del ejemplo resuelto al construir la tabla de distribucin de frecuencia de las cuentas por cobrar de Cabreras y Asociados que fueron los siguientes:ClasesP.M.Xififrfafafrafra

7.420 21.83514.628100.3310300.331.00

21.835 36.25029.04340.1314200.460.67

36.250 50.66543.45850.1719160.630.54

50.665 65.08057.87330.1022110.730.37

65.080 79.49572.28830.102580.830.27

79.495 93.91086.70350.173051.000.17

DESVIACIN TPICALa varianza a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar ese problema se define otra medida de dispersin, que es la desviacin tpica, o desviacin estndar, que se halla como la raz cuadrada positiva de la varianza. La desviacin tpica informa sobre la dispersin de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos. Esta medida viene representada en la mayora de los casos por S, dado que es su inicial de su nominacin en ingls.Desviacin tpica muestral Desviacin tpica poblacional

-->x = [17 14 2 5 8 7 6 8 5 4 3 15 9]x = 17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15. 9.-->stdev(x)ans = 4.716311-->Primero hemos declarado un vector con nombre X, donde introduzco los nmeros de la serie. Luego con el comando stdev se hallar la desviacin tpica.

DESVIACIN MEDIAEstadstica la desviacin absoluta promedio o, sencillamente desviacin media o promedio de un conjunto de datos es la media de las desviaciones absolutas y es un resumen de la dispersin estadstica. Se expresa, de acuerdo a esta frmula:

La desviacin absoluta respecto a la media, , la desviacin absoluta respecto a la mediana, , y la desviacin tpica, , de un mismo conjunto de valores cumplen la desigualdad:

Siempre ocurre que

donde el Rango es igual a:

El valor:

ocurre cuando los datos son exactamente iguales e iguales a la media aritmtica. Por otro lado:

cuando solo hay dos valores en el conjunto de datos.

VARIANZA La varianza es una medida estadstica que mide la dispersin de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones:

PROPIEDADESLa varianza es siempre positiva o 0: Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se modifica.[1] c Si a los datos de la distribucin los multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante.

Propiedad distributiva: cov

REFERENCIAS.http://es.wikipedia.org/w/index.php?title=Desviacin_media&oldid=75959388 Categora: http://es.wikipedia.org/w/index.php?title=Desviacin_media&oldid=75959388 Categora: Wikipedia:Artculos que necesitan referenciashttp://www.monografias.com/trabajos43/medidas-dispersion/medidas-dispersion.shtml#ixzz3FVJDlxLehttp://www.monografias.com/trabajos43/medidas-dispersion/medidas-dispersion.shtml#ixzz3FVJDlxLe

MEDIDAS DE FORMASESGOEn estadstica se llama sesgo de un estimador a la diferencia entre su esperanza matemtica y el valor numrico del parmetro que estima. Un estimador cuyo sesgo es nulo se llama insesgado o centrado.En notacin matemtica, dada una muestra y un estimador del parmetro muestral , el sesgo es:

El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad relacionada con sta es la de la consistencia: un estimador puede tener un sesgo pero el tamao de ste converge a cero conforme crece el tamao muestral.Dada la importancia de la falta de sesgo, en ocasiones, en lugar de estimadores naturales se utilizan otros corregidos para eliminar el sesgo. As ocurre, por ejemplo, con la varianza muestral.Formula para datos agrupados

Formula para datos agrupados

Otra propiedad razonable que podemos pedir al estimador de un parmetro es que, en promedio, sus valores coincidan con . Cuando sucede esto decimos que el estimador es centrado o insesgado. Un smil coloquial que suele aplicarse a la estimacin puntual es considerarla como un ejercicio de tiro a una diana. En este sentido, el centro de la diana sera el parmetro a estimar (). De manera los disparos de un tirador insesgado estaran centrados alrededor del centro de la diana. Mientras que los disparos de un tirador sesgado estaran sistemticamente desviados de la diana (como sucedera si el can de nuestra arma no estuviese recto).

Tirador insesgadoTirador sesgado

Podemos fijarnos que en la diana del tirador insesgado, el centro de masas de los disparos coincide con el centro de la diana (que representa el verdadero valor del parmetro). Como ya vimos anteriormente, el concepto de centro de masas est relacionado con la esperanza de una variable aleatoria y, precisamente as, obtenemos la definicin formal de estimador insesgado: un estimador T de un parmetro diremos que es centrado o insesgado si su esperanza es precisamente .

Si, al contrario, tenemos un estimador U sesgado, la desviacin respecto al verdadero valor a estimar se mide por el sesgo:

De manera que el sesgo de un estimador puede ser: Positivo: Si producen, en promedio, estimaciones por exceso. Cero: Si es un estimador centrado o insesgado. Negativo: Si producen, en promedio, estimaciones por defecto. Un ejemplo de estimador insesgado es la media aritmtica, que es un estimador insesgado de la esperanza de una variable aleatoria.

Un ejemplo de estimador sesgado es la varianza muestral, que es un estimador sesgado de la varianza poblacional.

Por tanto

Con lo que el sesgo de este estimador ser

Es decir, el sesgo es negativo y, por tanto, la varianza muestral es un estimador de la varianza poblacional sesgado por defecto. Por dicha razn, suele utilizarse la llamada varianza muestral corregida como estimador de la varianza poblacional:

que se comprueba trivialmente que s es un estimador insesgado.

APUNTAMIENTO

CURTOSIS O APUNTAMIENTOLa curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a la distribucin normal, es decir, mide cun puntiaguda es una distribucin.TIPOS DE CURTOSIS

La curtosis determina el grado de concentracin que presentan los valores en la regin central de la distribucin. As puede ser:Leptocrtica.- Existe una gran concentracin.Mesocrtica.- Existe una concentracin normal.Platicrtica.- Existe una baja concentracin.

MEDIDAS DE CURTOSIS

Medida de FisherPara datos sin agrupar se emplea la siguiente frmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:

Para datos agrupados en intervalos se emplea la siguiente frmula:

Donde: = cada uno de los valores; n = nmero de datos; = media aritmtica; = Cudruplo de la desviacin estndar poblacional; f = frecuencia absoluta; xm = marca de clasenotaSi a < 3 ? la distribucin es platicticaSi a = 3 ? la distribucin es normal o mesocrticaSi a > 3 ? la distribucin es leptocrtica

Medida basada en Cuartiles y Percentiles

(letra griega minscula kappa) = Coeficiente percentil de curtosisNota:Si < 0,263 ? la distribucin es platicrticaSi= 0,263 ? la distribucin es normal o mesocrticaSi > 0,263 ? la distribucin es leptocrticaEsta medida no es muy utilizada.Ejemplo ilustrativo: Determinar qu tipo de curtosis tiene la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.Solucin: Calculando la media aritmtica se obtiene

Calculando la desviacin estndar poblacional se obtiene:

MOMENTOSLos momentos potenciales o muestrales son valores que caracterizan a una muestra aleatoria. Los momentos muestrales aproximan a los momentos de la distribucin, estos ltimos tienen la propiedad de que dos distribuciones de probabilidad son iguales si tienen todos sus momentos iguales.Los momentos de una muestra forman una sucesin de nmeros, para cada nmero natural r se define puede definir el momento r-ensimo.MOMENTOS RESPECTO AL ORIGEN Los momentos muestrales estndar o centrados respecto al origen se calculan de la siguiente manera. Dada una muestra aleatoria de tamao N el momento muestral r-simo se calcula mediante:

Donde:son los diferentes valores que aparecen en la muestra.es el nmero de veces que se presenta el valor en la muestra.es el nmero total de elementos de la muestra.De modo que se cumple que el momento de orden 0 con respecto al origen vale 1 y el momento de orden 1 con respecto al origen es la media aritmtica:

MOMENTOS RESPECTO A LA MEDIA O CENTRALES

Se cumple que el momento de orden 0 con respecto a la media vale 1, el momento de orden 1 con respecto a la media vale 0 y el momento de orden 2 con respecto a la media es la varianza.

Los momentos de rdenes 3 y 4 con respecto a la media se emplean en el clculo de los coeficientes de asimetra y curtosis respectivamente.

BIBLIOGRAFAhttp://cetis112samsprobabilidadunidad2.blogspot.mx/2011/09/medidas-de-forma-sesgo.htmlhttp://cetis112samsprobabilidadunidad2.blogspot.mx/2011/09/apuntamiento.htmlhttp://cetis112samsprobabilidadunidad2.blogspot.mx/2011/09/momentos.html