trabajo investigacion

Download TRABAJO INVESTIGACION

Post on 07-Jan-2016

213 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

Cuartiles. Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Aparecen citados en la literatura cientfica por primera vez en 1879 por D. McAlister.1La diferencia entre el tercer cuartil y el primero se conoce como rango intercuartlico. Se representa grficamente como la anchura de las cajas en los llamados diagramas de cajas. Dada una serie de valores X1, X2, X3...Xn ordenados en forma creciente, podemos pensar que su clculo podra efectuarse: Primer cuartil (Q1) como la mediana de la primera mitad de valores;Segundo cuartil (Q2) como la propia mediana de la serie;Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.Pero esto conduce a distintos mtodos de clculo de los cuartiles primero (as como tercero) segn la propia mediana se incluya o excluya en la serie de la primera (respecto de la segunda) mitad de valores.Clculo con datos no agrupadosNo hay uniformidad sobre su clculo. En la bibliografa se encuentran hasta cinco mtodos que dan resultados diferentes.2 Uno de los mtodos es el siguiente: dados n datos ordenados,Para el primer cuartil:\frac{n+1}{4}Para el tercer cuartil:\frac {3(n+1)}{4}.

Percentiles.El percentil es una medida de tendencia central usada en estadstica que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo de observaciones. Por ejemplo, el percentil 20 es el valor debajo del cual se encuentran el 20 por ciento de las observaciones. Se representan con la letra P. Para el percentil i-simo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que l y el 100-i % restante son mayores.

Sesgo estadsticoEn estadstica se llama sesgo de un estimador a la diferencia entre su esperanza matemtica y el valor numrico del parmetro que estima. Un estimador cuyo sesgo es nulo se llama insesgado o centrado.En notacin matemtica, dada una muestra X_1, \dots, X_n\, iid X y un estimador T(x_1, \dots, x_n)\, del parmetro poblacional \theta\,, el sesgo es:E(T) - \theta\,El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad relacionada con sta es la de la consistencia: un estimador puede tener un sesgo pero el tamao de ste converge a cero conforme crece el tamao muestral.Dada la importancia de la falta de sesgo, en ocasiones, en lugar de estimadores naturales se utilizan otros corregidos para eliminar el sesgo. As ocurre, por ejemplo, con la varianza muestral.Aparecen citados en la literatura cientfica por primera vez por Francis Galton en 18851.P25 = Q1.P50 = Q2 = mediana.P75 = Q3.Ejemplo:Clculo con datos no agrupadosUn mtodo para establecer un percentil sera el siguiente: Calculamos...x = \frac{n\cdot i}{100} donde n es el nmero de elementos de la muestra e i, el percentil. El resultado de realizar esta operacin es un nmero real con parte entera E y parte decimal D. Teniendo en cuenta estos dos valores, aplicamos la siguiente funcin: P_i = \begin{cases} Elemento (E+1), & \mbox{para }D0 \\ \frac{elemento(E)+elemento(E+1)}{2}, & \mbox{para }D=0 \end{cases}Esta ltima operacin brinda el valor del percentil pedido.

Sesgo estadsticoEn estadstica se llama sesgo de un estimador a la diferencia entre su esperanza matemtica y el valor numrico del parmetro que estima. Un estimador cuyo sesgo es nulo se llama insesgado o centrado.En notacin matemtica, dada una muestra X_1, \dots, X_n\, iid X y un estimador T(x_1, \dots, x_n)\, del parmetro poblacional \theta\,, el sesgo es:E(T) - \theta\,El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad relacionada con sta es la de la consistencia: un estimador puede tener un sesgo pero el tamao de ste converge a cero conforme crece el tamao muestral.Dada la importancia de la falta de sesgo, en ocasiones, en lugar de estimadores naturales se utilizan otros corregidos para eliminar el sesgo. As ocurre, por ejemplo, con la varianza muestral.

Curtosis

En teora de la probabilidad y estadstica, la Curtosis es una medida de la forma. As, las medidas de Curtosis tratan de estudiar la proporcin de la varianza que se explica por la combinacin de datos extremos respecto a la media en contraposicin con datos poco alejados de la misma. Una mayor Curtosis implica una mayor concentracin de datos muy cerca de la media de la distribucin coexistiendo al mismo tiempo con una relativamente elevada frecuencia de datos muy alejados de la misma. Esto explica una forma de la distribucin de frecuencias con colas muy elevadas y con un centro muy apuntado.Definicin de Curtosis.Un coeficiente de apuntamiento o de Curtosis: es el basado en el cuarto momento con respecto a la media y se define como:\beta_2=\frac{\mu_4}{\sigma^4}Donde \mu_4 es el 4 momento centrado o con respecto a la media y \sigma es la desviacin estndar.No obstante, est ms extendida la siguiente definicin del coeficiente de Curtosis:g_2=\frac{\mu_4}{\sigma^4}-3

Donde al final se ha sustrado 3 (que es la Curtosis de la Normal) con objeto de generar un coeficiente que valga 0 para la Normal y tome a sta como referencia de apuntamiento:Tomando, pues, la distribucin normal como referencia, una distribucin puede ser:Ms apuntada y con colas menos anchas que la normal leptocrtica.Menos apuntada y con colas ms anchas que la normal - platicrtica.la distribucin normal es mesocrtica.En la distribucin normal se verifica que \mu_4=3\sigma^4, donde \mu_4 es el momento de orden 4 respecto a la media y \sigma la desviacin tpica.As tendremos que:Si la distribucin es leptocrtica \beta_2>3 y g_2>0Si la distribucin es platicrtica \beta_2