elementos basicos de estadistica

52
ELEMENTOS BÁSICOS DE ESTADÍSTICA RICHARD VIDAL MELIÁN SEDE TEMUCO 1 ESTADÍSTICA El término estadística proviene del latín status (que significa “estado”), y muchos la definen como el arte de la decisión frente a la incertidumbre”. La palabra "estadística" suele utilizarse bajo dos significados distintos: Como un conjunto de datos. Este es el significado más básico de estadística. Se entiende que dichos datos deben de estar presentados de manera ordenada y sistemática. Una información numérica cualquiera puede no constituir una estadística, para merecer este apelativo, los datos han de constituir un conjunto coherente, establecido de forma sistemática y siguiendo un criterio de ordenación. Así, algunos ejemplos de este “tipo de estadística” son: las estadísticas publicadas por el Instituto Nacional de Estadística (INE), las estadísticas publicadas por el Ministerio del Trabajo, etc. La estadística así utilizada, se define como Estadística Descriptiva, en el que los datos son recolectados, ordenados, resumidos y clasificados con objeto de tener una visión más precisa y conjunta de las observaciones, intentando descubrir de esta manera posibles relaciones entre los datos. También están entre los objetivos de la Estadística Descriptiva el presentarlos de tal modo que permitan sugerir o aventurar situaciones a analizar en mayor profundidad, así como estudiar si pueden mantenerse algunas suposiciones necesarias en determinadas inferencias como la de simetría, normalidad, etc. Como ciencia. La estadística estudia el comportamiento de los fenómenos de masas. Es decir, busca las características generales de un conjunto y, a menudo, prescinde de las características particulares de cada elemento. Por ejemplo, al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de nacimientos para obtener después la proporción de varones, sin importar, por ejemplo, el color de cabello o de ojos de los recién nacidos (que son características particulares). Es muy

Upload: karooooow

Post on 01-Oct-2015

108 views

Category:

Documents


5 download

DESCRIPTION

Matematicas.

TRANSCRIPT

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO1

    ESTADSTICAEl trmino estadstica proviene del latn status (que significa estado), y

    muchos la definen como el arte de la decisin frente a la incertidumbre.

    La palabra "estadstica" suele utilizarse bajo dos significados distintos:

    1 Como un conjunto de datos. Este es el significado ms bsico deestadstica. Se entiende que dichos datos deben de estar presentados demanera ordenada y sistemtica. Una informacin numrica cualquierapuede no constituir una estadstica, para merecer este apelativo, los datoshan de constituir un conjunto coherente, establecido de forma sistemtica ysiguiendo un criterio de ordenacin.

    As, algunos ejemplos de este tipo de estadstica son: las estadsticaspublicadas por el Instituto Nacional de Estadstica (INE), las estadsticaspublicadas por el Ministerio del Trabajo, etc.

    La estadstica as utilizada, se define como Estadstica Descriptiva, en elque los datos son recolectados, ordenados, resumidos y clasificados conobjeto de tener una visin ms precisa y conjunta de las observaciones,intentando descubrir de esta manera posibles relaciones entre los datos.

    Tambin estn entre los objetivos de la Estadstica Descriptiva elpresentarlos de tal modo que permitan sugerir o aventurar situaciones aanalizar en mayor profundidad, as como estudiar si pueden mantenersealgunas suposiciones necesarias en determinadas inferencias como la desimetra, normalidad, etc.

    2 Como ciencia. La estadstica estudia el comportamiento de los fenmenosde masas. Es decir, busca las caractersticas generales de un conjunto y, amenudo, prescinde de las caractersticas particulares de cada elemento. Porejemplo, al investigar el sexo de los nacimientos, iniciaremos el trabajotomando un grupo numeroso de nacimientos para obtener despus laproporcin de varones, sin importar, por ejemplo, el color de cabello o deojos de los recin nacidos (que son caractersticas particulares). Es muy

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO2

    frecuente enfrentarnos con fenmenos en los que es muy difcil predecir elresultado; as, por ejemplo, no podemos dar una lista, con las personas quevan a morir a una cierta edad, o el sexo de un nuevo ser hasta quetranscurra un determinado tiempo de embarazo. Por lo tanto, el objetivo dela estadstica, en este segundo significado, es hallar las regularidades quese encuentran en los fenmenos de masas.

    A este tipo de estadstica se le conoce como Estadstica Inferencial, es laque nos da informacin de la que se puede sacar conclusiones acerca de ungrupo grande de personas, lugares o cosas (poblacin), por medio de laobservacin de slo una parte del conjunto total (muestra).

    USOS Y ABUSOS

    Los primeros usos de la estadstica implicaron la recopilacin de datos y laelaboracin de grficas para describir diversos aspectos de un estado o de unpas. En el ao 1.662, John Graunt public informacin estadstica acerca delos nacimientos y de los decesos. Al trabajo de Graunt siguieron estudios detasas de mortalidad y de enfermedad, tamao de poblaciones, ingresos y tasasde desempleos.

    Los hogares, empresas y gobiernos se apoyan bastante en datosestadsticos para dirigir sus acciones. Por ejemplo, el gobierno recopila conregularidad datos que permiten determinar el nivel de desempleo de lapoblacin con capacidad laboral. Esta informacin permitir al gobiernodeducir si las medidas tomadas, con anterioridad, para disminuir la tasa dedesempleo han surtido efectos o no. Si la tasa de desempleo ha disminuido,entonces las medidas tomadas fueron las correctas y se podra seguir en lamisma lnea de accin; por el contrario, si la tasa de desempleo ha aumentado,se deben cambiar o mejorar las medidas anteriormente tomadas por elgobierno, ya que no han producido el efecto deseado.

    Por otra parte, las empresas se preocupan de recopilar informacin acercade la tasa de inflacin, los ndices del consumidor, entre otros indicadores,para tomar decisiones que afectan sus futuras contrataciones, niveles de

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO3

    produccin y la expansin a nuevos mercados, as como tambin el cierre demercados que ya no son rentables.

    Lamentablemente, en ocasiones nos encontramos con situaciones en dondese hace un abuso de la estadstica, ya sea falsificando datos, realizandopreguntas predispuestas, etc.

    Existen muchos aspectos que afectan las preguntas de una encuesta. staspueden estar cargadas o redactadas intencionalmente de manera que generenuna respuesta deseada. David W. Moore describe un experimento donde sepregunt a diferentes sujetos si estaban de acuerdo con las siguientesdeclaraciones:

    Se gasta muy poco dinero en subsidios del Estado. Se gasta muy poco dinero en asistencia a las personas de escasos

    recursos.

    An cuando son las personas de escasos recursos quienes reciben elsubsidio del Estado, slo el 19 % estuvo de acuerdo cuando se usaron laspalabras subsidios del Estado, aunque el 63 % estuvo de acuerdo conasistencia a las personas de escasos recursos.

    A veces los estudios reciben el patrocinio de grupos con interesesespecficos que buscan promover. Por ejemplo, Kiwi Brands, un fabricante deabrillantador de calzado, encarg un estudio que suscit la siguientedeclaracin impresa en algunos peridicos: De acuerdo con una encuestanacional realizada a 250 trabajadores profesionales, la razn ms comn delfracaso de un solicitante de trabajo de sexo masculino al dar una buenaprimera impresin, fue llevar los zapatos desaseados. Claramente, elresultado de esta encuesta nos est dando un mensaje, cul? - es vlidodicho resultado?.

    Tambin nos podemos encontrar con empresas que entregan informacinque es tcnicamente correcta pero engaosa. Por ejemplo, una compaaautomotriz dice: El 90 % de todos nuestros vehculos, vendidos en el pas enlos ltimos 10 aos, contina en circulacin. El comn de las personas, al

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO4

    escuchar este anuncio, pensarn que los vehculos de dicha empresa son debuena calidad y no se dan cuenta de que el 90 % de los vehculos vendidos pordicha empresa fueron vendidos en los ltimos 2 o 3 aos, de manera quedichos vehculos estn casi nuevos. Al no entregar una informacin completase puede originar que las personas saquen conclusiones errneas.

    DEFINICIN DE CONCEPTOSPara poder lograr un buen entendimiento de la estadstica, primero, es

    necesario que manejemos un vocabulario estadstico mnimo. A continuacin,se definen los conceptos ms comnmente utilizados es estadstica.

    Censo: recoleccin de datos de cada elemento de una poblacin. Datos: son las informaciones o nmeros recolectados que describen alguna

    caracterstica. Datos continuos: datos que se obtienen de un nmero infinito de valores

    posibles que corresponden a puntos de una escala continua que abarcan unrango de valores sin interrupciones o vacos.

    Datos cualitativos: datos que se pueden dividir en diferentes categorasque se distinguen por alguna caracterstica no numrica.

    Datos cuantitativos: datos que consisten en nmeros que representanconteos o mediciones.

    Datos discretos: datos con la propiedad de que el nmero de valoresposibles es un valor finito(o que puede contarse) y que es representado porun nmero entero.

    Estadstica: coleccin de mtodos para planear experimentos, que permiteobtener, organizar, resumir, presentar, analizar e interpretar datos, y sacarconclusiones con base a esos datos.

    Estadstico: caracterstica medida de una muestra. Experimento: es la aplicacin de un tratamiento, seguida por la

    observacin de sus efectos sobre los sujetos. Hiptesis: declaracin o afirmacin acerca de alguna propiedad de una

    poblacin. Muestra: subconjunto de la poblacin.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO5

    Muestra aleatoria: muestra seleccionada de tal manera que permite a cadamiembro de la poblacin tener la misma posibilidad de ser escogido.

    Parmetro: caracterstica medida de una poblacin. Poblacin: coleccin entera y completa de elementos por estudiar. Recorrido: el recorrido de una variable corresponde a la diferencia entre el

    valor mximo y el valor mnimo de la variable. Simetra: propiedad de datos cuya distribucin puede dividirse en dos

    mitades que son aproximadamente imgenes especulares trazando unalnea vertical por la mitad.

    Variable aleatoria: variable (casi siempre representada con x) que tiene unsolo valor numrico (determinado al azar) para cada resultado de unexperimento.

    PARMETRO O ESTADSTICO?Para poder saber si lo que estamos calculando corresponde a un parmetro

    o a un estadstico, debemos identificar si dicho clculo ha resultado delanlisis de una poblacin o de una muestra. Veamos los siguientes ejemplos:

    Ej. 1: Cuando Juan X fue elegido presidente del pas NN, recibi el 68,5% de4.784.973 votos. Si consideramos que el conjunto formado por todos los votosemitidos es la poblacin, entonces el 68,5% es un parmetro.

    Ej. 2: Para saber si un ejecutivo cualquiera de la ciudad de Temuco contrataraa un postulante cuyo curriculum vitae tiene ms de un error ortogrfico, seescogi al azar a un grupo de 45 ejecutivos de dicha ciudad y se les realiz lapregunta correspondiente, encontrndose que el 63% de ellos no lo contratara.Como la encuesta se realiz slo a un grupo ( muestra ) de los ejecutivos dela ciudad de Temuco y no a todos los ejecutivos de la ciudad (poblacin),podemos decir que el 63 % representa a un estadstico.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO6

    TIPOS DE VARIABLES

    La estadstica descriptiva es una ciencia que analiza series de variables(estatura, color de ojos, estado civil, etc.) y trata de extraer conclusiones sobreel comportamiento de estas variables. Estas variables pueden ser de dos tipos:

    Variables cuantitativas: consisten en nmeros que representan conteos omediciones. Por ejemplo: peso, estatura, nmero de hijos, etc.

    Variables cualitativas: consisten en datos que representan algunacaracterstica no numrica. Tambin suele llamrseles como datos(variables) categricos o de atributos. Por ejemplo: estado civil de unapersona, color de ojos, estado de nimo, nacionalidad, etc.

    Las variables cuantitativas, a su vez se pueden dividir en: variablesdiscretas y en variables continuas.

    Las variables discretas, son aquellas en donde el nmero de posiblesvalores es un nmero finito y entero. Por ejemplo: el nmero de hijos quetiene una persona, la cantidad de monedas de $ 100 que tenemos en estemomento en el bolsillo, etc.

    Las variables continuas, son aquellas que tienen infinitos posibles valoresdentro de un intervalo, y que pueden asociarse a alguna escala continua. Porejemplo: la rapidez que tiene un vehculo, la estatura, el peso, etc.

    NIVELES DE MEDICINOtra forma muy utilizada para clasificar las variables, es el uso de cuatro

    niveles de medicin: nominal, ordinal, de intervalo y de razn. Cuando laestadstica se aplica a problemas reales, el nivel de medicin de las variableses un factor importante para determinar el procedimiento a utilizar.

    Nivel de medicin Nominal: se utiliza cuando los datos consistenexclusivamente en nombres, etiquetas o categoras que no pueden

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO7

    acomodase segn un esquema de orden. Por ejemplo: los colores de losautomviles, el estado de nimo, etc.

    Debido a que los datos nominales carecen de un orden o de unsignificado numrico, no pueden utilizarse para realizar clculos. A vecesse asignan nmeros a diferentes categoras (como al estado civil al llenarun formulario), pero tales nmeros no tienen significado computacional, ycualquier promedio que se calcule carece de sentido.

    Nivel de medicin Ordinal: se utiliza cuando los datos puedenacomodarse en algn orden, aunque no es posible determinar diferenciasentre los valores de los datos o tales diferencias carecen de sentido. Porejemplo: si las notas de un alumno se clasifican con la escala A, E, I, O oU, se pueden ordenar de manera ascendente o descendente, pero no esposible decir, por ejemplo, que A E = I.

    Los datos ordinales ofrecen informacin sobre comparaciones relativas,aunque no sobre la magnitud de las diferencias (si A es la nota mayor,podemos decir que A es mayor que E, pero no podemos decir cuntomayor es A que E).

    Nivel de medicin de Intervalo: es un nivel parecido al nivel ordinal, perocon la propiedad adicional de que la diferencia entre dos valores de datoscualesquiera s tiene un sentido. Sin embargo, los datos en este nivel notienen un punto de partida natural desde cero (donde nada de la cantidadest presente). Por ejemplo: 10 y 30 estn en este nivel de medicin,y podemos calcular su diferencia que es 20 . Sin embargo, no existe unpunto de partida natural, ya que 0 no representa la ausencia total decalor. Por lo tanto, es errneo decir que una sustancia que est a 30 esttres veces ms caliente que una sustancia a 10 .

    Nivel de medicin de Razn: es un nivel parecido al nivel de intervalo,aunque tiene la propiedad adicional de que s tiene un punto de partida ocero natural (donde cero indica que nada de la cantidad est presente).Para valores en este nivel, tanto las diferencias como las proporcionestienen significado. Por ejemplo: en los precios de libros de estadstica, $0

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO8

    representa ningn costo, y un libro de $30.000 cuesta el doble que uno de$15.000.

    Este nivel de medicin se denomina de razn porque el punto de partidacero hace que las razones o cocientes tengan significado.

    Entre los cuatro niveles de medicin, los que presentan mayoresdificultades para identificarlos son los de intervalo y los de razn. Para noequivocarse al clasificar una variable, se debe tener en cuenta que el nivel deintervalo tiene un cero que se establece por convencin y puede tenervariaciones, es decir, es arbitrario. Por otra parte, el nivel de razn tiene uncero real, fijo, no sujeto a variaciones; es propio de la medicin hecha.

    MTODO ESTADSTICO Y SUS ETAPASORGANIZACIN DE LA INFORMACIN

    Una vez obtenida una muestra de cualquier poblacin y observados losvalores que toma la variable en los individuos de la muestra, estos valores sesuelen ordenar. Si la variable es cuantitativa la ordenacin ser de menor amayor, aunque tambin puede hacerse de mayor a menor. Dada una variableX, consideramos una muestra de tamao n que toma k valores distintos: x 1, .. . , x k ( si la variable es cuantitativa: x 1 < x 2 < . . . < x k ). La frecuenciaabsoluta de un valor x i es el nmero de veces que dicho valor aparece en lamuestra. Se representa por n i y cumple que:

    La expresin anterior nos indica que la suma de las frecuencias absolutasde todos los datos distintos de la muestra es equivalente al tamao n de lamuestra.

    Los datos recolectados se pueden representar, en general, a travs de tablasde distribucin de frecuencias (TDF) y a travs de grficos.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO9

    TABLAS DE DISTRIBUCIN DE FRECUENCIAS ( TDF )Una distribucin de frecuencias es la representacin estructurada, en

    forma de tabla, de toda la informacin que se ha recogido sobre la variableque se estudia.

    Las tablas estadsticas se clasifican segn el nmero de observaciones ysegn el recorrido de la variable estadstica. De esta forma, tenemos lossiguientes tipos de tablas estadsticas:

    a) Tablas tipo Ib) Tablas tipo IIc) Tablas tipo III

    a) Tabla Tipo ISe utiliza cuando el tamao de la muestra y el recorrido de la variable son

    pequeos. En este tipo de tabla se debe simplemente anotar los datos demanera ordenada (ascendente o descendente) en filas o columnas.

    Ejemplo: La edad de los 5 hermanos de una familia es: 14, 20, 12, 22, 16

    Tabla Tipo I 12 14 16 20 22Tamao de la muestra: n = 5Recorrido = 22 12 = 10

    b) Tabla Tipo IISi el tamao de la muestra es grande y el recorrido de la variable es

    pequeo, se debe resumir estos datos en una tabla tipo II.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO10

    Ejemplo: Al preguntar el nmero de personas que trabajan en 50 familias,obtenemos la siguiente informacin:

    2 1 2 2 1 2 0 2 1 12 3 0 1 1 1 3 0 2 22 2 1 2 1 1 1 3 2 23 2 3 1 2 4 2 1 4 11 0 4 3 2 2 2 1 3 3

    Podemos observar que la variable tiene las siguientes caractersticas:

    Tamao de la muestra: n = 50Recorrido = 4 0 = 4

    La tabla tipo II queda como se muestra a continuacin:

    Personas quetrabajan

    Nmero deFamilias

    0 41 162 193 84 3

    Total n = 50

    c) Tabla Tipo III

    Cuando el tamao de la muestra y el recorrido de la variable son grandes,utilizar una tabla tipo II no sera muy conveniente debido a que quedara muyextensa, por lo tanto, se debe agrupar en intervalos los valores de la variable.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO11

    Ejemplo 3: Si a un grupo de 30 alumnos les preguntamos el dinero que en esemomento llevan en sus bolsillos, nos encontramos con los siguientes datos:

    450 1152 250 300 175 80 25 2680 605 7855 180 200 675 500 375 1500 205 1595 985

    315 425 560 1100 2300 5000 1200 100 185 125

    Podemos observar que la variable tiene las siguientes caractersticas:Tamao de la muestra: n = 30Recorrido = 5.000 5 = 4.995

    Ahora, debemos determinar la amplitud de los intervalos, y para ellonecesitaremos decidir cuntos intervalos queremos?

    A continuacin, se presenta una metodologa para decidir el nmero deintervalos y la amplitud de ellos.

    1 Debemos decidir el nmero de intervalos o categoras o clases. El nmeroelegido depende del nmero de observaciones disponibles. Si n es elnmero de observaciones, se puede utilizar como referencia:

    , grandeesnonsink ),(log22.31 casootroennk (Regla de Sturges)

    2 Localizar la observacin mayor y menor, es decir el valor mximo y elvalor mnimo de las observaciones.

    3 Hallar la diferencia entre estos dos valores (restar mximo menos elmnimo). Esta diferencia se denomina rango o recorrido de los datos.

    mnmx xxr

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO12

    4 Hallar la longitud mnima requerida para cubrir este rango dividiendo elrango por el nmero de categoras o clases. Este cociente se denominaamplitud de la clase o del intervalo de clase.

    kxx

    a mnmx

    As la divisin en clases o intervalos podra tomarse como:

    L0 =xmn; L1 =L0 +a ; L2 =L0 +2a; ; Lk = L0 + ka.

    5 Hallar la marca de clase de cada intervalo, que est definida por:

    21 iii

    LLm

    Donde corresponde al lmite superior del intervalo , y es el lmiteinferior del intervalo .

    Ejemplo: Los siguientes datos representan el peso, medido en kilogramos, deun grupo de personas que estn con tratamiento por sobrepeso.

    85,3 87,5 87,8 88,5 89,9 90,4 91,8 92,7 95,6 96,1 94,286,7 87,8 88,2 88,6 90,3 91,0 91,8 93,2 94,7 94,2 93,388,3 88,3 89,0 89,2 90,4 91,0 92,3 93,3 92,7 92,6 91,589,9 90,1 90,1 90,8 90,9 91,1 92,7 93,4 91,2

    En este tipo de ejercicios tenemos varias opciones para confeccionar la tabla.

    Opcin 1:623,6)24(log22,31 k (Nmero de intervalos)

    Rango = r = ( 96,1 85,3 ) = 10,88,1

    68,10

    kxx

    a mnmx (Amplitud de los intervalos)

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO13

    La tabla tipo III queda como se muestra a continuacin:Peso [Kg] Personas (ni) Marca de clase (mi)

    85,3 87,1 2 86,287,1 88,9 8 8888,9 90,7 9 89,890,7 92,5 10 91,692,5 94,3 10 93,494,3 96,1 3 95,2

    n = 42

    Observe que el lmite superior de un intervalo, coincide con el lmiteinferior del intervalo siguiente. Por esta razn, por convencin, se consideraque el extremo izquierdo de todos los intervalos es cerrado y el extremoderecho de todos los intervalos es abierto, excepto el ltimo intervalo cuyoextremo derecho se considera cerrado.

    Otra consideracin que debiramos tener, es que el nmero de intervalos kse puede aproximar hacia arriba en lugar de hacia abajo, por lo tanto, en elejercicio anterior el nmero de intervalos sera k = 7, lo que obviamente haracambiar la amplitud de los intervalos. De hecho, el escoger un nmero mayorde intervalos (k = 7, en este caso), hara que los clculos realizadosposteriormente tuvieran un error menor.

    Opcin 2:

    Se puede alterar el recorrido de la muestra redondeando los valoresmximo y mnimo.

    853,85 minmin xx (Redondeamos hacia abajo)971,96 maxmax xx (Redondeamos hacia arriba)

    Como el tamao de la muestra no ha cambiado:

    623,6)24(log22,31 k (Nmero de intervalos)Rango = r = (97 85) = 12

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO14

    26

    12

    kxx

    a mnmx (Amplitud de los intervalos)

    La tabla tipo III queda como se muestra a continuacin:

    Peso [Kg] Personas (ni) Marca de clase (mi)85 87 2 8687 89 9 8889 91 12 9091 93 10 9293 95 7 9495 97 2 96

    n = 42

    OBS.: tenga en cuenta que slo se han presentado 2 opciones para este tipo detabla, ya que existen otros casos en donde el lmite superior de un intervalo nocoincide con el lmite inferior del intervalo siguiente.

    TIPOS DE FRECUENCIAS

    Una TDF no est completa si no se toman en cuenta las otras frecuenciasque existen. Ya sabemos de la existencia de la Frecuencia Absoluta (ni), querepresenta la cantidad de veces que un dato se presenta en la muestra.

    La Frecuencia Absoluta Acumulada (Ni) corresponde a la suma de lasfrecuencias absolutas hasta el intervalo o clase i (o hasta el i-simo datodistinto). Por ejemplo, si deseamos determinar el valor de la frecuenciaabsoluta acumulada en el intervalo 4 (o hasta el cuarto dato distinto de laTDF), N4, se debe realizar la siguiente operacin:

    Donde K representa el nmero de datos (o clases) distintos en la muestra.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO15

    La Frecuencia Relativa ( h i o f i ) representa la porcin o porcentaje querepresenta una frecuencia absoluta ni con respecto al tamao total n de lamuestra. Es decir:

    La Frecuencia Relativa Acumulada (Hi o Fi) representa la suma de lasfrecuencias relativas hasta el intervalo o clase i (o hasta el i-simo datodistinto). Por ejemplo, si deseamos determinar el valor de la frecuenciarelativa acumulada en el intervalo 4 (o hasta el cuarto dato distinto de laTDF), H4, se debe realizar la siguiente operacin:

    Al completar nuestra ltima tabla, quedar como se muestra a continuacin:

    Peso[Kg]

    Personas( n i )

    N i h i ( % ) H i ( % ) Marca declase (mi)

    85 87 2 2 4,76 4,76 8687 89 9 11 21,43 26,19 8889 91 12 23 28,57 54,76 9091 93 10 33 23,81 78,57 9293 95 7 40 16,67 95,24 9495 97 2 42 4,76 100 96

    Las frecuencias relativas y relativas acumuladas se pueden expresar en suforma decimal o en su forma porcentual.

    Observe que la ltima frecuencia relativa acumulada H6, tiene un valor de100 % (o 1 en su forma decimal). As debiera ocurrir siempre, ya querepresenta el 100 % de los datos de la distribucin.

    Adems, se puede apreciar que la ltima frecuencia absoluta acumuladaN6 es igual a 42, que coincide con el tamao de la distribucin; tambin estodebiera ocurrir siempre.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO16

    Se aconseja confeccionar la TDF tipo III, con las dos opcionesvistas, tomando k = 7, y comparar las tablas obtenidas.

    TIPOS DE GRFICOSEn funcin de la naturaleza de los datos y de la forma en que stos se

    presenten existen distintos tipos de representaciones. A continuacin semuestran los grficos ms utilizados.

    a) Grfico Circular: este tipo de grfico se emplea para representar,generalmente, atributos (variables cualitativas). Para construir un grficocircular se separa el crculo en las proporciones que representa cada dato oclase con respecto al total de la distribucin.

    Ejemplo: Una empresa tuvo lassiguientes ventas, en millones dedlares, en el ao 2.010.

    Trimestre Ventas Porcentaje1 8,2 58,572 3,2 22,863 1,4 104 1,2 8,57

    Total 14,0 100

    Ventas por trimestre

    58,57%22,86%

    10,00%8,57%

    Las ventas en cada trimestre se pueden representar como un porcentaje deltotal de las ventas realizadas en los cuatro trimestres. As, por ejemplo, los 8,2

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO17

    millones de dlares vendidos en el Trimestre 1corresponden al 58,57% deltotal de las venta. La suma de todos los porcentajes (conocidos comofrecuencias relativas) debe ser equivalente al crculo completo, es decir, al100%.

    b) Histograma: es una grfica de barras en donde la escala horizontalrepresenta clases (intervalos) de valores de datos y la escala verticalrepresenta frecuencias (que pueden ser absolutas o relativas). Las alturas delas barras corresponden a los valores de las frecuencias, en tanto que lasbarras se dibujan de manera adyacente (sin espacios entre ellas).

    Ejemplo: En un curso de 27alumnos se recolectan los pesos decada alumno. La TDF resultante semuestra a continuacin:

    Pesos [Kg] Alumnos [ni]50 55 255 60 560 65 1265 70 8

    Si las amplitudes de los intervalos son distintas, el eje vertical quedarrepresentado por la densidad del intervalo (di), que est definida como lafrecuencia absoluta dividida en la amplitud del intervalo o clase.

    c) Polgono de frecuencias: este tipo de grfico utiliza segmentos linealesconectados a puntos que se localizan directamente por encima de losvalores de las marcas de clase. Las alturas de los puntos corresponden a lasfrecuencias de la clase, en tanto que los segmentos lineales se extiendenhacia la derecha y hacia la izquierda, de manera que la grfica inicia ytermina sobre el eje horizontal.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO18

    Ejemplo: La siguiente tablamuestra los niveles de cotininade un grupo de fumadores.

    Cotinina Personas mi0 99 11 49,5

    100 199 12 149,5200 299 14 249,5300 399 1 349,5400 499 2 449,5

    d) Grfico de Barras: Cuando se quieren representar variables discretas ovariables cualitativas, se puede utilizar este tipo de grfico, que es similar aun Histograma, pero con la diferencia de que las barras estn separadas. Enel eje de las ordenadas (eje vertical) se representan las frecuenciasabsolutas o relativas y en el eje de las abscisas (eje horizontal) la variableen estudio. Mediante este grfico, tambin podemos comparar una variableen dos poblaciones diferentes, esto generalmente lo debemos hacerutilizando las frecuencias relativas.

    Ejemplo: En una encuestarealizada a 22 matrimonios, seles pregunt la cantidad dehijos que consideraban ideal.Los resultados se muestran enla siguiente TDF.

    N hijos N familias1 72 93 44 2

    Existen otras muchas grficas: de ojiva, de tallo y hoja, de dispersin, dereas, etc. Cada uno de estos grficos tiene sus propias condiciones de uso. Sedebe tener en cuenta que un buen grfico debe resumir en forma clara lamisma informacin que se presenta en una TDF.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO19

    MEDIDAS DE POSICIN1. MEDIDAS DE TENDENCIA CENTRAL

    Las medidas de tendencia central son valores tpicos o representativos deun conjunto de datos. Como tales valores suelen situarse hacia el centro delconjunto de datos ordenados por magnitud, deben a esta situacin su nombre.

    Se definen varios tipos, siendo los ms comunes: la media aritmtica, lamediana, la moda y la media ponderada, entre otras. Cada una de estasmedidas tiene sus ventajas y desventajas, dependiendo de los datos y losobjetivos perseguidos.

    a) MEDIA ARITMETICA ( )

    Toda media debiera cumplir con las siguientes condiciones:

    Para su obtencin deben utilizarse todas las observaciones. Debe ser un valor comprendido entre el menor y el mayor de los valores

    de la distribucin. Debe venir expresada en la misma unidad que los datos.

    De entre todas las medias, la que ms se apega a estas condiciones es lamedia aritmtica ( ), que se define de la siguiente manera:

    n

    x

    x

    n

    ii

    1(si los datos no se repiten, no agrupados).Para variables discretas.

    n

    nx

    x

    k

    iii

    1

    (si los datos se repiten, datos agrupados).Para variables discretas.

    Donde:n: tamao de la muestra.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO20

    k: nmero de datos distintos.x i: i simo dato distinto de la distribucin.n i: es la frecuencia absoluta del i simo dato distinto de la distribucin.

    Si la variable es continua, en lugar de utilizar x i se utiliza la marca de clasem i de cada intervalo.

    La media aritmtica tiene algunas propiedades que la hacen una medidaptima de representacin, las cuales se enuncian a continuacin:

    La suma de las desviaciones de los valores de la distribucin respecto a lamedia es igual a cero, es decir:

    01

    i

    k

    ii nxx

    La suma de los cuadrados de las desviaciones de los valores de la variablecon respecto a un nmero cualquiera se hace mnima cuando dicho nmerocoincide con la media aritmtica. Es decir:

    Mnimoni ik

    ixx

    1

    2)(

    Si a cada observacin de una distribucin X se le suma una constante p(traslacin), se tiene una nueva variable Y = X + p con media aritmticaigual a la de X ms la constante p. O sea:

    pXpXY

    Si se multiplica una variable X por una constante p (homotecia), lavariable resultante Y = p X tendr media aritmtica igual a p por la mediade X. O sea:

    XpXpY

    Las dos propiedades anteriores (traslacin y homotecia) se pueden aplicaral mismo tiempo, es decir, si a una variable X se le multiplica por una

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO21

    constante a y luego se le suma una constante b, se obtendr una nuevavariable Y, cuya media estar determinada por:

    bXaYbXaY

    Si en un conjunto de valores se pueden obtener 2 ms subconjuntosdisjuntos, la media aritmtica del conjunto se relaciona con la mediaaritmtica de cada uno de los subconjuntos disjuntos de la siguiente forma:

    n

    nx

    X

    k

    Iii

    1

    Siendo ix la media de cada subconjunto y n i el nmero de elementos decada subconjunto.

    b) MEDIA PONDERADA ( )

    Otra media que tiene inters prctico es la media ponderada. Esta consisteen asignar a cada valor xi un peso wi que depende de la importancia relativa decada uno de estos valores bajo algn criterio. Su expresin responde a:

    k

    iii

    k

    iiii

    p

    wn

    wnx

    x

    1

    1

    Ejemplo: Un alumno, al final del semestre acadmico, tiene las siguientescalificaciones en sus pruebas parciales: 6,2; 4,8 y 6,2. En un trabajo deinvestigacin obtuvo un 5,8 y en la exposicin del trabajo de investigacinlogr un 4,8. Las pruebas parciales tienen todas igual ponderacin, la cualcorresponde al 25% cada una, el trabajo de investigacin se pondera con un10% y la exposicin con un 15%. Cul es el promedio final de este alumno?

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO22

    Solucin: como existen diferentes ponderaciones, para poder determinar elpromedio final, debemos trabajar con la media ponderada.

    6,5100560

    1511012531518,41018,52518,42522,6

    1

    1

    k

    iii

    k

    iiii

    p

    wn

    wnx

    x

    Por lo tanto, el alumno tiene un promedio final de 5,6.

    Observe que el 1 que aparece multiplicando no es obligatorio incluirlo, yaque el 1 es el elemento neutro para la multiplicacin.

    c) MEDIANA ( Me)

    La mediana es un valor que, previa ordenacin, deja la mitad de lasobservaciones en la recta real a la izquierda y la otra mitad a la derecha. Esdecir, el 50% de los datos son menores o iguales que la mediana y el otro 50%son mayores o iguales a sta. Para su clculo, y suponiendo que los valoresestn ordenados, se procede de la siguiente manera:

    Si los datos vienen dados por extensin, y hay un nmero impar de ellosla mediana es el elemento que se encuentra en el centro, es decir:

    21nxMe

    Si el nmero de datos es par habra dos elementos centrales y lamediana se obtendra como el promedio de ambos, es decir:

    2

    122

    nn

    xx

    Me

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO23

    Si la distribucin viene agrupada en intervalos, se construye tambin lacolumna de Ni para fijar el intervalo donde se encuentra la mediana,ste queda determinado porque es el primero que verifica que lafrecuencia absoluta acumulada del intervalo es mayor o igual que n/2.Una vez fijado el intervalo, la mediana adopta la siguiente expresin:

    ii

    i

    i an

    Nn

    LMe

    1

    12

    Li-1: corresponde al lmite inferior del intervalo mediano.ai: es la amplitud del intervalo mediano.ni: es la frecuencia absoluta del intervalo mediano.Ni-1: corresponde a la frecuencia absoluta acumulada anterior a la Ni que

    cumple con: 2/nN i

    d) MODA (Mo)

    La moda absoluta, o simplemente moda, corresponde al dato que msveces se presenta en una distribucin de datos. Si existen dos datos queocurren con la misma frecuencia y sta es la ms alta, ambos valores sernmodas, por lo que la distribucin es bimodal. Si ms de dos datos cumplen lasmismas condiciones, entonces la distribucin es multimodal. Si todos losdatos tienen la misma frecuencia absoluta, entonces no existe moda. Ademsde la moda absoluta, aquellos valores que tengan frecuencia mayor a la de losvalores adyacentes sern modas relativas.

    En el caso de tener una distribucin continua de datos (datos conintervalos), la moda se debe determinar a partir de la siguiente expresin:

    ii aLMo

    21

    11

    L i-1: lmite inferior del intervalo modal.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO24

    1: diferencia entre la frecuencia modal y la frecuencia de la clase inferiorinmediata. 2: diferencia entre la frecuencia modal y la frecuencia de la clase superiorinmediata.a i: amplitud del intervalo modal.

    Existe una frmula abreviada para determinar la moda, la cual es:

    iii

    ii a

    nn

    nLMo

    11

    11

    1in : corresponde a la frecuencia absoluta anterior a la frecuencia modal.

    1in : corresponde a la frecuencia absoluta siguiente a la frecuencia modal.

    Si las amplitudes a i no son todas iguales, en las expresiones anterioresse debe considerar que en lugar de trabajar con las frecuencias absolutas, sedebe trabajar con las densidades. La densidad di est definida como:

    i

    ii

    a

    nd

    As, por ejemplo, la frmula abreviada para la moda con intervalos de distintaamplitud quedara como sigue:

    iii

    ii add

    dLMo

    11

    11

    1id : corresponde a la densidad anterior a la densidad modal.1id : corresponde a la densidad siguiente a la densidad modal.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO25

    2. MEDIDAS DE POSICINSe llaman medidas de posicin o cuantiles de orden k a aquellas que

    dividen a la distribucin en k partes, de tal forma que en cada una de esaspartes haya el mismo nmero de elementos. De entre todas las medidas deposicin o cuantiles destacan: los cuartiles (Qr), los deciles (Dr) y lospercentiles (Pr).

    Los cuartiles dividen a la distribucin en cuatro partes iguales, los decilesen diez y los percentiles en cien partes iguales.

    Existen tres cuartiles ( Q 1, Q 2, Q 3 ), nueve deciles ( D 1, D 2, , D 9 ) ynoventa y nueve percentiles ( P 1, P 2, , P 99 ).

    El segundo cuartil, el quinto decil y el quincuagsimo percentil son igualesy coinciden con la mediana. Es decir:

    MePDQ 5052En distribuciones con variables continuas (con intervalos), el clculo de

    cualquier cuantil es idntico al clculo de la mediana, slo que ahora se buscala primera frecuencia absoluta acumulada (Ni) que cumpla con la siguientecondicin:

    KnrN i

    Donde:r: es la posicin del cuantil buscado.n: es el tamao de la distribucin.

    4; Si se est calculando un Cuartil Qr.K = 10; Si se est calculando un Decil Dr.

    100; Si se est calculando un Percentil Pr.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO26

    La expresin que permite determinar el valor de un cuantil es:

    ii

    i

    ir an

    NK

    nr

    LC

    1

    1

    Donde Cr corresponde al cuantil buscado.

    Los cuartiles se pueden describir de la siguiente forma:

    Q1 (Primer cuartil): el 25% de los valores previamente ordenados de ladistribucin son menores o iguales que Q1, y el otro75% de los valores previamente ordenados de ladistribucin son mayores o iguales que Q1.

    Q2 (Segundo cuartil): el 50% de los valores previamente ordenados de ladistribucin son menores o iguales que Q2, y el otro50% de los valores previamente ordenados de ladistribucin son mayores o iguales que Q2.

    Q3 (Tercer cuartil): el 75% de los valores previamente ordenados de ladistribucin son menores o iguales que Q3, y el otro25% de los valores previamente ordenados de ladistribucin son mayores o iguales que Q3.

    La descripcin para los deciles y los percentiles es anloga al de loscuartiles, teniendo en cuenta que entre dos deciles consecutivos existe el 10%de los datos de la distribucin, y entre dos percentiles consecutivos existe el1% de los datos de la distribucin.

    MEDIDAS DE DISPERSIN

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO27

    Las medidas de tendencia central o posicin nos indican donde se sita unconjunto de observaciones. En cambio, las medidas de variacin o dispersinnos indican si esas observaciones o valores estn prximas entre s o por elcontrario estn muy dispersas.

    Por otra parte, entregan informacin sobre la bondad de los promedioscalculados como representantes del conjunto de datos.

    Existen muchas medidas de dispersin: rango, desviacin media,desviacin tpica, varianza, coeficiente de variacin, rango o recorrido semi-intercuartlico, entre otras.

    a) VARIANZA Y DESVIACIN TPICALa varianza y su raz cuadrada positiva, la desviacin tpica, son las ms

    importantes medidas de dispersin, estando ntimamente ligadas a la mediacomo medida de representacin de sta. La varianza viene dada por laexpresin:

    n

    nxx

    Si

    k

    ii

    2

    12)(

    Su forma abreviada es:

    21

    2

    2____

    22 xn

    nx

    xxS

    k

    iii

    En tanto, la desviacin tpica o estndar viene dada por:

    2SS

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO28

    Es comn utilizar la letra S (en la varianza o desviacin tpica) cuando setrabaja con una muestra, y la letra griega si se trabaja con una poblacin.

    La unidad de medida de la desviacin tpica es la misma unidad con la quese miden los datos. En tanto, la unidad de la varianza es la misma que la de losdatos, pero elevadas al cuadrado.

    Algunas propiedades de la desviacin tpica son:

    Es una medida de variacin de todos los valores con respecto a lamedia aritmtica.

    Su valor suele ser positivo, y slo es igual a cero cuando todos losvalores de los datos son iguales.

    Los valores grandes de la desviacin tpica indican mayoresdesviaciones de los datos con respecto a la media aritmtica.

    Su valor se puede incrementar de manera drstica con la inclusin deuno o ms valores distantes (valores de datos que se encuentran muylejos de los dems).

    OBS.: si se trabaja con una distribucin continua (con intervalos) losvalores x i se deben reemplazar por las marcas de clase m i.

    b) COEFICIENTE DE VARIACINSe define como el cociente entre la desviacin tpica y el valor absoluto de

    la media. Se trata de una medida adimensional, que tiene en cuenta el rango devalores en el que se mueve. Permite comparar la dispersin de variasdistribuciones, es invariante respecto a homotecias y sensible frente atraslaciones. Adems de lo anterior, el coeficiente de variacin da informacinsobre la representatividad de la media; y aunque no hay valores fijos decomparacin, pues depende de circunstancias, tales como el nmero deobservaciones, se puede considerar, a efectos prcticos, una cota de 0,5 como

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO29

    lmite superior para admitir que la media representa aceptablemente alconjunto de la distribucin.

    Su expresin es de la forma:

    %100x

    SCvbienox

    SCv

    En cuanto a la variabilidad o dispersin de los datos, podemosapoyarnos en la siguiente tabla:

    GRADO DE VARIABILIDAD DELOS DATOS

    COEFICIENTE DEVARIABILIDAD (CV)

    Con variabilidad baja Menos de un 10 %Con variabilidad moderada Entre un 10 % y un 30 %Con alta variabilidad Ms de un 30 %

    EJERCICIOS RESUELTOS

    1. Al preguntar el nmero de personas que trabajan a 50 familias, se obtienenlas siguientes respuestas:

    2 1 2 2 1 2 0 2 1 1 2 2 1 3 2 4 32 3 0 1 1 1 3 0 2 2 4 2 2 3 4 0 12 2 1 2 1 1 1 3 2 3 2 3 1 1 1 2

    Se pide:a) Confeccionar la TDF correspondiente.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO30

    b) El promedio de personas que trabajan por familia.c) La moda y frecuencia modal.d) La mediana.e) La varianza y desviacin tpica.f) Es representativa la media aritmtica?. Para responder esto, considere

    como valor lmite para el coeficiente de variacin 50%.

    Solucin:

    a) Podemos observar que la variable toma valores comprendidos entre 0 y 4,por lo tanto tiene un recorrido pequeo, y como la distribucin es detamao 50, se considera grande. Por lo que al confeccionar la tabla (tipoII), sta queda como se muestra a continuacin:

    Personas quetrabajan

    Nmero de Familias(n i)

    Ni h i (%) H i (%)

    0 4 4 8 81 16 20 32 402 19 39 38 783 8 47 16 944 3 50 6 100

    Total n = 50

    b) El promedio corresponde a la media aritmtica, por lo tanto, debemosutilizar la siguiente frmula:

    n

    nx

    x

    k

    iii

    1

    Al desarrollarla, queda la siguiente expresin:

    )(8,150

    348319216140 personasx

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO31

    Por lo tanto, en cada una de las 50 familias hay en promedio 1,8 personas quetrabajan. Claro que, como no pueden existir fracciones de personas, llevandoel resultado a una situacin ms real, podemos decir que en cada una de las 50familias hay en promedio aproximadamente 2 personas que trabajan.

    c) En este tipo de tabla, la moda se determina simplemente identificando qudato tiene mayor frecuencia absoluta. En este caso, ese dato es 2.

    Por lo tanto: Mo = 2 (personas) y Frec. Modal = 19 (familias).

    Esto quiere decir que la cantidad de personas que trabajan, entre las 50familias, que ms se repite es 2.

    d) Como la distribucin es de una variable discreta y tiene una cantidad par dedatos, n = 50, el clculo de la mediana se realiza a travs de:

    2

    122

    nn

    xx

    Me

    Al desarrollarla, queda la siguiente expresin:

    )(22

    2222

    )26()25(1250

    250

    personasxx

    xx

    Me

    Por lo tanto, podemos decir que en el 50% de las familias hay a lo ms 2personas que trabajan, y en el otro 50% de las familias hay por lo menos 2personas que trabajan.

    e) Para la varianza, utilizamos la siguiente expresin:

    n

    nxx

    Si

    k

    ii

    2

    12)(

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO32

    Al desarrollarla, queda la siguiente expresin:

    503)8,14(8)8,13(19)8,12(16)8,11(4)8,10( 222222 S

    )(1 22 personaS

    Qu pasar si utilizamos la frmula abreviada?

    )(2____

    22 abreviadafrmulaxxS )(18,1

    50)348319216140( 22222222 personaS

    (Observe que el clculo de la varianza se hizo con el valor real de la mediaaritmtica, y no con el valor aproximado).

    Ahora, la desviacin tpica o estndar es:

    )(112 personaSS f) Para saber si la media aritmtica es representativa o no, debemos calcular

    el coeficiente de variacin:

    %56,55%1008,1

    1%100 x

    SCv

    Como se fij, para este ejercicio, una cota superior para Cv de 50 %, podemosconcluir que la media aritmtica no es representativa de la distribucin dada.Adems, basndonos en la tabla de los grados de variabilidad, podemosafirmar que los datos poseen una gran variabilidad.

    2. Las edades de un grupo de personas se muestra en la siguiente tabla:

    Edad (aos) Personas (ni)

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO33

    7 9 49 11 1511 13 1413 15 2515 17 2017 19 2

    Se pidea) Completar la TDF.b) El promedio de edad de las personas.c) La moda y la mediana.d) La varianza y la desviacin tpica.e) Q 1, D 7 y P 40

    Solucin:

    a) Al completar la TDF nos queda:

    Edad (aos) Personas (ni) Ni hi (%) Hi (%) mi7 9 4 4 5 5 89 11 15 19 18,75 23,75 10

    11 13 14 33 17,5 41,25 1213 15 25 58 31,25 72,5 1415 17 20 78 25 97,5 1617 19 2 80 2,5 100 18

    b) Como la distribucin es continua, utilizamos las marcas de clase paradeterminar el promedio (media aritmtica).

    n

    nm

    x

    k

    iii

    1

    Desarrollando esta expresin, obtenemos:

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO34

    )(2,1380

    218201625141412151048aosx

    Por lo tanto, las personas tienen en promedio 13,2 aos.

    c) La moda la determinamos tomando en cuenta que: primero, las amplitudesson iguales, la frecuencia modal es 25 y que el intervalo modal es [13, 15[,y usamos la siguiente expresin:

    ii aLMo

    21

    11

    1114251 520252

    Por lo tanto:

    )(375,142511

    1113 aosMo

    Si calculamos la moda con la frmula abreviada, obtendremos lo siguiente:

    iii

    ii a

    nn

    nLMo

    11

    11

    )(177,1421420

    2013 aosMo

    Observe que usando ambas expresiones, los resultados estn en el intervalomodal [13,15[, como debe ocurrir siempre.

    Para el clculo de la mediana utilizamos la expresin:

    ii

    i

    i an

    Nn

    LMe

    1

    12

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO35

    Primero determinamos: 402

    802

    nN i

    La primera frecuencia absoluta acumulada que cumple con esta condicin es:

    2521315

    [15,13[33

    58

    1

    i

    i

    i

    i

    n

    aAmplitudIntervaloN

    N

    )(56,13225

    332

    80

    13 aosMe

    Resultado que est en el intervalo mediano.

    d) La varianza la determinamos de la siguiente manera:

    n

    nxm

    Si

    k

    ii

    2

    12)(

    Se utiliza mi en lugar de x i debido a que estamos trabajando con una variablecontinua.

    Al desarrollar la expresin, resulta:

    802)2,1318(20)2,1316(25)2,1314(14)2,1312(15)2,1310(4)2,138( 2222222 S

    )(26,6 22 aosS

    Por lo tanto, la desviacin tpica es:)(502,226,62 aosSS

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO36

    e) Para determinar los cuantiles, se procede de manera similar que con lamediana.

    Clculo de Q1

    1421113

    [13,11[19

    33

    204801 1

    i

    i

    i

    i

    i

    n

    aAmplitudIntervaloNN

    knrN

    )(143,11214

    194801

    111 aosQ

    Clculo de D 7

    2521315

    [15,13[33

    58

    5610

    807 1

    i

    i

    i

    i

    i

    n

    aAmplitudIntervaloNN

    knrN

    )(84,14225

    3310

    807

    137 aosD

    Clculo de P40

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO37

    1421113

    [13,11[19

    33

    32100

    8040 1

    i

    i

    i

    i

    i

    n

    aAmplitudIntervaloNN

    knrN

    )(857,12214

    19100

    8040

    1140 aosP

    3. Un grupo de alumnos tiene como tarea contar, durante 30 minutos, en unainterseccin de calles de su ciudad, la cantidad de automviles que pasan, yanotar su respectivo color. El resultado se muestra en la tabla siguiente:

    Color Cantidad de automvilesBlanco 35Negro 12Rojo 23Gris 18Azul 9Otro 13Total 110

    Se pide:a) Qu tipo de variable se midi?b) Cul es la variable medida?c) En qu nivel de medicin est la variable?d) Cul es la moda de la distribucin?e) Cul es el promedio de la distribucin?

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO38

    f) Qu porcentaje de vehculos grises pasaron en ese tiempo por esainterseccin de calles?

    g) Cuntos vehculos, en promedio, pasan por minuto aproximadamente endicha interseccin?.

    Solucin:

    a) La variable es cualitativa.b) La variable medida es el color de los automviles.c) El nivel de medicin de la variable es nominal.d) Blanco.e) El promedio no se puede determinar ya que la variable es cualitativa.f) El porcentaje de vehculos grises es:

    )%(36,1610011018% vehculosGris

    g) Los vehculos por minuto que pasan por dicha interseccin son:

    min)/(4min)/(67,330

    110vehculosvehculosR

    EJERCICIOS PROPUESTOS

    1. En los siguientes ejercicios, determinar si el valor dado es un Estadstico oun Parmetro.

    a) El Senado actual de un pas X de Amrica consta de 60 hombres y 40mujeres.

    b) Se selecciona a 40 estudiantes del Instituto Profesional La Araucana yel nmero promedio de libros comprados este semestre por ellos es 4,2.

    c) Se toma una muestra de estudiantes y el promedio de la cantidad detiempo de espera en la fila para comprar libros este semestre es 0,25horas.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO39

    d) En un estudio de los 2.223 pasajeros del Titanic, se encontr que 706sobrevivieron cuando se hundi.

    e) Cuando Abraham Lincoln fue elegido presidente por primera vez,recibi el 39,82 % de 1.865.908 votos.

    f) Con base a una muestra de 877 ejecutivos encuestados, se encontr queel 45% de ellos no contratara a alguien con un error ortogrfico en susolicitud de empleo.

    2. En los siguientes ejercicios, determinar si los valores dados provienen deun conjunto de datos discreto o continuo.

    a) La cantidad de huevos que pone una gallina en un da.b) La cantidad de leche que una vaca produce en una semana.c) Un estudiante de estadstica obtiene datos muestrales y encuentra que la

    media del peso de automviles en la muestra es 3.126 libras.d) En una encuesta de 1.059 adultos, se encontr que, aproximadamente, el

    39% de ellos tienen pistolas en sus casas.e) Cuando se probaron 19.218 mscaras antigs de divisiones de la milicia

    de EE.UU., se encontr que 10.322 estaban defectuosas.

    3. En los ejercicios siguientes, determine cul de los cuatro niveles demedicin (nominal, ordinal, de intervalo o de razn) es el ms apropiado.

    a) Las estaturas de las mujeres que juegan bsquetbol en Chile.b) Las calificaciones de fantstico, bueno, promedio, pobre o inaceptable

    en citas a ciegas.c) Las temperaturas actuales en las salas de clases en el IPLA.d) Las calificaciones del Sernac de mejor compra, recomendado, no

    recomendado.e) El nmero de respuestas s recibidas cuando se les pregunt 1.250

    conductores si haban usado alguna vez telfono celular mientrasconducan.

    f) Los colores de los automviles conducidos por estudiantes del IPLA.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO40

    4. En los ejercicios siguientes, identifique la muestra y la poblacin. Tambindetermine si la muestra parece ser representativa de la poblacin.

    a) Un reportero del diario El Metiche de Temuco, se para en una esquinay pregunta a 10 adultos si creen que el presidente actual est haciendoun buen trabajo.

    b) En una encuesta realizada por una organizacin X, en la ciudad de A laque te criaste, aplicada a 1.059 adultos seleccionados aleatoriamente,el 39 % respondi s cuando se le pregunt: Tiene usted un armade fuego en su casa?.

    5. En una tira cmica, Brutus (uno de los personajes) se alegra por unincremento en la temperatura de 1 a 2 . Cuando alguien le preguntaqu tiene de bueno estar a 2 , l responde que hace dos veces ms calorque en la maana. Explique por qu Brutus est equivocado.

    6. Un grupo de estudiantes desarroll una escala para calificar la calidad de lacomida de la cafetera de una escuela, donde 0 representaba neutral: nibuena ni mala. Se asignaron nmeros negativos a las comidas malas ynmeros positivos a las comidas buenas; la magnitud del nmerocorresponda a la severidad de lo bueno o lo malo. Las primeras trescomidas se calificaron con: 2, 4 y 5. Cul sera el nivel de medicin decalificaciones como stas? Explique su respuesta.

    7. De la siguiente distribucin de datos (medidos en horas), se pide:a) Confeccionar tabla de distribucin de frecuencias.b) Media aritmtica.c) Moda y frecuencia modal.d) Mediana.e) Varianza y desviacin tpica.f) Si la cota superior para el coeficiente de variacin es del 40%, es

    representativa la media aritmtica?.

    1 2 4 3 2 0 9 2 0 2 0 0 42 0 7 1 4 3 0 2 1 0 4 3 03 0 2 0 1 6 5 2 0 0 1 0 37 1 0 0 3 2 0 1 0 5 2 0 1

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO41

    8. Se ha realizado una encuesta en 30 hogares en la que se les pregunta elnmero de personas que conviven en el domicilio habitualmente. Lasrespuestas obtenidas han sido las siguientes:

    4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2 3, 4, 5, 5,6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3

    a) Confeccione la Tabla de Distribucin de Frecuenciasb) Calcule Media Aritmticac) Calcule: Moda Absoluta y Relativa, Frecuencia Modal y Mediana.d) Varianza y desviacin tpica.e) Coeficiente de variacin.

    9. Los alumnos de una carrera del IPLA son 30, y tienen un promedio de edad23,5 aos. Si a dos semanas de comenzadas las clases se integran 5alumnos de edades: 25, 21, 26, 28 y 20 aos, cul es el nuevo promediode edad del curso?.

    10. Un curso de 25 alumnos tiene una estatura promedio de 1,62 (m), y otrocurso de 37 alumnos tiene una estatura promedio de 1,68 (m). Si se juntanambos cursos, cul es la nueva estatura promedio?.

    11. Para superar la asignatura de estadstica, un alumno debe ser evaluado endistintas pruebas referentes a la misma: test, problemas y prctica, cada unade ellas ponderada segn su importancia o contribucin en la nota final.As, los pesos de cada prueba sern del 30%, 50% y 20% respectivamente.Sabiendo que las notas obtenidas por el alumno en cada prueba son 7, 3 y 5respectivamente, cul es la nota final en la asignatura?

    12. Un alumno tiene las siguientes notas con sus respectivas ponderaciones:

    P1 = 5,9 Peso = 10 %P2 = 3,3 Peso = 15 %P3 = P Peso = 25 %P4 = 2,6 Peso = 35 %P5 = 4,0 Peso = 15 %

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO42

    Qu nota debe sacar este alumno en la Prueba 3 para aprobar laasignatura con un promedio igual a 4,2 sin aproximacin?

    13. De un examen realizado a un grupo de alumnos, cuyas notas se hanevaluado del 1 al 8, se ha obtenido el siguiente cuadro estadstico:

    X i n i N i h i o f i H i o F i1 4 0,082 43 16 0,164 7 0,145 5 286 387 7 45 0,148

    Se pide:a) Completar la tabla estadstica.b) Cantidad de alumnos que se han evaluado.c) Cantidad de alumnos que han obtenido una nota superior a 3.d) Porcentaje de alumnos que han sacado una nota igual a 6.e) Porcentaje de alumnos que han obtenido una nota superior a 4.f) Alumnos que han obtenido una nota superior a 2 e inferior a 5.g) Calcular: media aritmtica, moda, mediana.h) Determinar la varianza y desviacin estndar.

    14. En una empresa X, el salario por semana de 160 trabajadores sedistribuye de la siguiente forma:

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO43

    Salarios($miles)

    n i

    4 8 38 12 12

    12 16 4016 20 4720 24 1324 28 3228 32 932 36 4

    Se pide:a) Completar la TDF.b) El salario promedio semanal y mensual de

    los trabajadores.c) Moda Absoluta y Relativad) Medianae) Coeficiente de variacin.f) Q3, D6 y P45

    15. La distribucin de las acciones de una determinada sociedad viene dadaen la siguiente tabla:

    Nmero deacciones

    Nmerode

    accionistas0 20 10

    20 28 3228 32 5032 48 848 55 1455 60 10

    Determinar:a) Completar la TDF, incluyendo

    marcas de clase y densidades.b) Promedio de acciones por

    accionista.c) Moda Absoluta y Relativa.d) Medianae) Coeficiente de variacin.f) Q 1, D 2 y P 90

    16. En un estudio sobre consumo degasolina en una gran ciudad se eligiuna muestra de 100 vehculos y seobserv el nmero de litros queconsuman en un da, obtenindose lasiguiente distribucin de frecuencias:(trabaje con 2 decimales)

    N delitros

    Nautomviles

    1 7 27 10 4

    10 12 3512 14 2514 18 3218 30 2

    a) Complete la TDF, incluyendo las respectivas marcas de clase ydensidades.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO44

    b) Calcule Media Aritmtica.c) Determine el valor de la Moda Absoluta y Relativa, Frecuencia Modal y

    Mediana.d) Qu se puede decir sobre la variabilidad de los datos?e) Determine el valor de: Q1, Q2, D4, D8, P40 y P55.f) Qu se puede observar entre D4 y P40? Puede explicar esta situacin?

    17. El Grfico 2, corresponde a la cantidad de das por mes que un grupo deestudiantes realiza deportes, en el barrio El ltimo paga:

    Grfico 2

    15

    1012

    1815

    86

    3 2 10

    5

    10

    15

    20

    [0-3[ [3-6[ [6-9[ [9-13[ [13-16[ [16-19[ [19-21[ [21-24[ [24-27[ [27-30[

    Das

    Estu

    dian

    tes

    a) De cuntos alumnos cuenta la muestra?b) Cuntos das en promedio los estudiantes de este barrio realizan

    deportes?c) Cul es la mediana?d) Cul es la moda de la muestra?e) Cuntos estudiantes hacen deportes por lo menos 9 das al mes?f) Cuntos estudiantes hacen deportes menos de 21 das al mes?g) Cuntos estudiantes hacen deportes por lo menos 13 das y menos de

    21 das?h) Cuntos estudiantes hacen deportes como mnimo 24 das al mes?i) Comente la siguiente frase: La Moda est dentro del intervalo [9,13[.j) Comente la siguiente frase: Segn el tercer intervalo, hay 12

    estudiantes que realizan deportes 6 das al mes.

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO45

    k) Comente la siguiente frase: Segn el ltimo intervalo, hay 1 estudianteque realiza deportes los ltimos 3 das del mes.

    18. La distribucin de los pesos de 40 estudiantes se muestra en la tablasiguiente:

    Peso (lb) n i118 126 3127 135 5136 144 9145 153 12154 162 5163 171 4172 180 2

    a) Completar la TDF.b) Determinar el peso promedio de los alumnos.c) Determinar moda y mediana.d) Calcular el coeficiente de variacin.e) Determinar Q 3, D 6 y P 84

    19. Los alumnos de un curso confeccionan una TDF en donde anotan unaserie de datos, entre los cuales se encuentra su estado de nimo ese da. Elresultado se muestra en la tabla siguiente:

    Estadode nimo

    Alumnos

    Alegre 12Triste 3

    Enojado 1Eufrico 2Pesimista 4

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO46

    No sabe 4Total 26

    Se pide:a) Completar la TDF.b) Qu tipo de variable se midi?c) Cul es la variable medida?d) En qu nivel de medicin est la variable?e) Cul es la moda de la distribucin?f) Qu porcentaje de alumnos est triste ese da?

    20. Un General de Carabineros llega a una comisara y a las primeras trespersonas que encontr descansando les pregunt su rango, obteniendo lassiguientes respuestas: Cabo Primero, Teniente y Sargento.

    a) Cul es la variable involucrada?b) Qu tipo de variable es?c) En qu nivel de medicin est la variable?d) Cul es la moda de la variable?

    21. El da en que se evala una asignatura, se presentan tres situaciones en losalumnos: nerviosismo (no s si estudi lo suficiente), indiferencia (elque nada sabe, nada teme y yo nada temo) y la confianza (estuditodo lo que dijo mi Sensei).

    a) Cul es la variable involucrada?b) Qu tipo de variable es?c) En qu nivel de medicin est la variable?

    22. Las etapas de la vida de un ser vivo se pueden resumir, en general, de lasiguiente manera: nace, crece, se reproduce y muere. En qu nivel demedicin est la variable?

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO47

    SOLUCIONARIO

    1. a) Parmetro b) Estadstico c) Estadstico d) Parmetro e) Parmetrof) Estadstico

    2. a) Discreto b) Continuo c) Continuo d) Discreto e) Discreto

    3. a) De razn b) Ordinal c) De intervalo d) Ordinal e) De raznf) Nominal

    4.a) Muestra: los 10 adultos encuestados; Poblacin: todos los adultos de

    Temuco; No es representativa

    b) Muestra: los 1.059 adultos seleccionados; Poblacin: todos los adultosde la ciudad; Es representativa.

    5. Como la temperatura est en un nivel de medicin de intervalo, no tienesentido decir que hace dos veces ms calor , ya que esta escala notiene un punto de partida natural.

    6. Ordinal es el nivel de medicin ms adecuado, ya que se puede dar unorden a la calidad de la comida. Aunque la calidad tiene asignado unnmero no es de intervalo, ya que la diferencia entre un alimento decalificacin de 1 y un alimento de calificacin de 2 no es la misma queexiste entre un alimento con calificacin de 9 y otro con calificacin de 10.

    7.b) 1,94 (horas) c) Mo = 0 (horas) y fMo= 18d) 2 (horas) e) S2 = 4,53 (horas2) y S = 2,13 (horas)f) CV = 109,79%; por lo tanto, la media aritmtica no es representativa de

    la distribucin.

    8.b) 3,53 (personas) c) (Mo)abs = 3 (personas) y fMo= 8 (hogares)

    Moda relativa no hay; Me = 3 (personas)d) S2 = 2,98 (personas2) y S = 1,73 (personas)

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO48

    e) CV = 49%

    9. 23,57 (aos) 10. 1,66 (m) 11. 4,6 12. 6,42

    13.b) 50 (alumnos) c) 34 (alumnos) d) 20%e) 54% f) 15 (alumnos)g) Prom.= 4,76; (Mo)abs = nota 6; (Mo)rel = nota 3; Me = nota 5h) S2 = 4,38; S = 2,09

    14.b) Prom. Sem. = 19,175($miles); Prom. Men.= 76,7 ($miles)c) (Mo)abs = 16,683($miles); (Mo)rel =25,81($miles)d) Me = 18,128 ($miles)e) Cv = 32,44%f) Q3 = 24,625 ($miles); D6 = 19,489 ($miles); P45 = 17,447 ($miles)

    15.b) Prom. = 32,13 (acciones)c) (Mo)abs = 29,66 (acciones); (Mo)rel = no hayd) Me = 29,6 (acciones)e) Cv = 38,97%f) Q1 = 25,25 (acciones); D2 = 23,7 (acciones); P90 = 53,8 (acciones)

    16.b) Prom. = 13,12 (litros)c) (Mo)abs = 11,53 (litros) y fMo =35 (automviles); (Mo)rel = no hay

    Me = 12,72 (litros)d) Como el Cv = 23,02%, la variabilidad de los datos es moderada.e) Q1 = 11,09 (litros); Q2 = 12,72 (litros); D4 = 11,94 (litros)

    D8 = 15,75 (litros); P40 = 11,94 (litros); P55 = 13,12 (litros)f) Se observa que D4 = P40; esto se debe a que ambos representan el

    mismo porcentaje de la distribucin, 40%.

    17.a) 90 (alumnos); b) 10,89 (das al mes)

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO49

    c) Me = 10,78 (das al mes)d) (Mo)abs1 = 2,25 (das al mes); (Mo)abs2 = 13,53 (das al mes)e) 53 (alumnos) f) 84 (alumnos) g) 29 (alumnos) h) 3 (alumnos)i) La distribucin es bimodal, una de las modas est en el intervalo [0,3[ y

    la otra moda est en el intervalo [13,16[, por lo tanto la frase esincorrecta.

    j) La frase es incorrecta, debido a que el tercer intervalo indica que existen12 alumnos que realizan deportes entre 6 y 9 das al mes, [6,9[.

    k) La frase es incorrecta, debido a que el ltimo intervalo indica que existe1 alumno que realiza deportes entre 27 y 30 das al mes, [27,30[.

    18.b) 146,975 (lb)c) Me = 146,75 (lb); Mo = 147,2 (lb)d) Cv = 9,336%e) Q3 = 155,3 (lb); D6 = 149,75 (lb); P84 = 161,78 (lb)

    19.b) Variable cualitativa; c) Estado de nimod) Nominal; e) Alegre; f) 11,54%

    20.a) Rango (militar); b) Variable cualitativac) Ordinal; d) No hay moda

    21.a) Estado anmico frente a una evaluacinb) Variable cualitativac) Nominal

    22. Ordinal

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO50

    Formulario

    1. Media aritmtica

    n

    x

    x

    n

    ii

    1 (si los datos no se repiten)

    n

    nx

    x

    k

    iii

    1 (si los datos se repiten)

    2. Media ponderada

    k

    iii

    k

    iiii

    p

    wn

    wnx

    x

    1

    1

    3. Mediana).(var;

    21 discretaimparnxMe n

    ).(var;2

    122 discretaparn

    xx

    Menn

    ).(var;21

    1 continuaan

    Nn

    LMe ii

    i

    i

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO51

    4. Moda

    )(21

    11 exactafrmulaaLMo ii

    1: diferencia entre la frecuencia modal y la frecuencia de la claseinferior inmediata.2: diferencia entre la frecuencia modal y la frecuencia de la clasesuperior inmediata.

    )(11

    11 abreviadafrmulaa

    nn

    nLMo iii

    ii

    igualesnoamplitudes

    abreviadaFrmulaa

    dddLMo i

    ii

    ii ;

    11

    11

    )( densidada

    ndi

    ii

    5. Cuantiles

    ii

    i

    ir an

    NK

    nr

    LC

    1

    1

    4; Si se est calculando un Cuartil.K = 10; Si se est calculando un Decil.

    100; Si se est calculando un Percentil.

    6. Varianza y Desviacin Tpica

  • ELEMENTOS BSICOS DE ESTADSTICA

    RICHARD VIDAL MELIN SEDE TEMUCO52

    )(;)( 2

    12 Varianzan

    nxx

    Si

    k

    ii

    )(;212

    2____

    22 abreviadafrmulaxn

    nx

    xxS

    k

    iii

    )(;2 tpicadesviacinSS

    7. Coeficiente de Variacin

    %100x

    SCvbienox

    SCv

    GRADO DE VARIABILIDAD DELOS DATOS

    COEFICIENTE DEVARIABILIDAD (CV)

    Con variabilidad baja Menos de un 10 %Con variabilidad moderada Entre un 10 % y un 30 %Con alta variabilidad Ms de un 30 %