estadística i usam

146
ESTADÍSTICA I ESTADÍSTICA I Prof. Edwin Gerardo Acuña Prof. Edwin Gerardo Acuña Acuña Acuña San José. Costa Rica. Mayo 2012 1

Upload: edwin-acuna

Post on 24-Jun-2015

3.997 views

Category:

Documents


2 download

TRANSCRIPT

  • 1. ESTADSTICA IProf. Edwin Gerardo Acua Acua1San Jos. Costa Rica. Mayo 2012

2. Qu es estadstica? 2 3. La estadstica es una rama de las matemticas,que a travs de un conjunto de tcnicas,mtodos, normas, reglas y procedimientos quese ocupan en observar, reunir, agrupar,cuantificar y organizar los datos de una muestra,permita no solo describir un hecho ocomportamiento de un fenmeno, tambinanalizar y evaluar conclusiones acerca de unapoblacin.3 4. Cualquier persona recibe informacin en formade datos a travs de los peridicos, la televisinu otros medios; y a menudo es necesario obteneralguna conclusin a partir de la informacincontenida en los datos. 4 5. Ejemplos de aplicacin de la Estadstica. 5 6. Ejercicio 1 Se desea investigar durante el mes de enero de esteao, la opinin de los costarricenses mayores de 18aos sobre los distintos casos de corrupcin queinvolucra a expresidentes.6 7. Ejercicio 2 Se desea conocer el porcentaje de personas queobserv el ltimo encuentro de ftbol de laseleccin nacional, para ello se realizar unestudio telefnico en el GranreaMetropolitana, entre personas mayores de 12aos. 7 8. Ejercicio 3 Ingreso salarial neto de los empleados del ICE. El nmero de citas que atiende una clnica. El grado acadmico de un profesor universitario. El distrito de residencia de los costarricenses. El nmero de personas que mueren a causa del SIDA cadaao. Si una persona ha visitado el parque Simn Bolvar. Nivel de rating de una emisora radial Nmero de placa de un vehculo 8 9. Proporcionar las tcnicas, mtodos y procedimientosrequeridos para describir y analizar un conjuntos dedatos y as simplificar sus resultados. Permite describir sus caractersticas y analizar elestudio de los fenmenos, de los datos destacados(HOLGUIN, 1993, Pg. 14) Obtener conclusiones de una poblacin, a partir de ladescripcin y anlisis realizados a una muestra.(SANDOVAL, 2001, P. 15)9 10. Las tcnicas estadsticas utilizadas para interpretar los datos de una investigacin pueden ser clasificadas en dos grandes grupos en funcin deque su objetivo sea describir las caractersticasobservadas de una muestra o inferir conclusionessobre la poblacin de la que dicha muestra ha sidoextrada.SE CLASIFICA ENDOS RAMAS DESCRIPTIVAINFERENCIAL10 11. La estadstica descriptiva es una rama de la estadstica,que se encarga en representar a un fenmeno refiriendo variables que caracterizan los datos de lamuestra de una poblacin. El proceso que sigue laestadstica descriptiva para elPROCESO estudio de una cierta poblacin consta de los siguientes pasos:11 12. Seleccin de variables e indicadores (es unamanifestacin, observable y medible de loscomponentes de una variable) (Quivy, 2000)Mediante la recoleccin de datos se obtiene elvalor de cada individuo en los caracteresseleccionados de la muestra.Elaboracin de tablas de frecuencias, mediantela adecuada ordenacin, clasificacin ydistribucin de los datos del fenmenoestudiado.Representacin grfica de los resultados. 12 13. La estadstica inferencial, extrae y analiza las caractersticas de los datos obtenidos de una muestras formados por individuos de unapoblacin. A partir del estudio de la muestra sepretende conducir a un resultado de losaspectos relevantes de toda la poblacin. Paracuyo estudio se requiere de conocimientos de estadstica, probabilidad y matemticas.(Esta rama de la estadstica se estudia en la asignaturaEstadstica Aplicada a la Investigacin Social II) 13 14. Concepto de estadsticadescriptiva e Inferencial. 14 15. POBLACIONEs un conjunto de valores posibles o el recuentode todos los elementos que presentan unacaracterstica comn que toma de un colectivo ouniverso de objetos, ideas, acontecimientos oindividuos, al cual se refiere el estudio que sepretende realizar. El termino poblacin, se usa para denotar elconjunto de elementos del cual extrae unamuestra.15 16. MUESTRA Es un subconjunto de una poblacin lacual nos puede servir para generalizaracerca de la poblacin de estudio.Muestra aleatoria:Esta se obtiene cuando seleccionamos unamuestra de una poblacin en la que todos loselementos son INDEPENDIENTES YtienenIGUAL oportunidad de serseleccionados16 17. MUESTRA La muestra nos sirve para poderrepresentar el comportamiento de lapoblacin con alto grado de confianza. El xito del proyecto depende de la formaen que se seleccione al elemento queparticipar en el estudio.17 18. Por qu emplear muestras? La poblacin es infinita Poblacin finita pero muy grande, seraimposible o muy costoso estudiarla. La unidad estadstica se transforma odestruye al ser analizada Los resultados que se obtendran al realizaruna encuesta por muestreo seran suficientesy precisos. 18 19. Es un proceso que determina cmo sern seleccionados loselementos de una parte de la poblacin, para que se puedanobtener conclusiones fiables a partir de la muestra, es importante tanto su tamao como el modo en que han sidoextrados los objetos, ideas, acontecimientos o individuos que componen el estudio. Existen diferentes tipos de diseo de muestreo,cada uno de ellos tienen caractersticas que sepueden ocupar segn el tipo de poblacin y elobjetivo la investigacin. 19 20. Tipos de muestras Aleatorias: Muestreo simple al azar Muestreo sistemtico Muestreo estratificado Muestreo por conglomeradoss No aleatorias: Muestreo por cuotas Muestreo por criterio Muestreo por conveniencia20 21. Error de muestreo Se presenta slo en muestras aleatorias. Es la diferencia entre el resultado dado por lamuestra y el resultado que se hubieraobtenido si se hubiera hecho un censo. Ventaja: se puede medir haciendo uso de lateora de la probabilidad.21 22. Sesgo Error sistemtico (se da en todas lasobservaciones) en un slo sentido. No es medible. Tipos Sesgo de seleccin. Sesgo de medicin.22 23. DATO Se le conoce como dato u observacin, acada resultado que se obtiene al realizar unexperimento. 23 24. INFORMACION A menudo se tiene que organizar loshechos para que te digan algo. Es en esemomento en que habrs convertido losdatos en informacin. 24 25. Un instrumento es un mecanismo por el cual se recopilandatos con las variables que pretende medir a travs de:la observacin encuestaentrevistao cuestionariobasados en los objetivos de la investigacin.EL INSTRUMENTO TIENE QUE TENER LAS PROPIEDADES DE:VALIDEZ CONFIABILIDAD25 26. El termino validez denota la utilidad cientfica de uninstrumento de medida en el que puede establecerampliamente qu tan bien mide lo que pretende medir.A la validez se le ha dado tres significadosprincipales: Validez de contenido Validez de criterio Validez de constructo26 27. VALIDEZ DE CONTENIDO Se refiere al grado en que la medicin abarca lagama de significados que comprende el concepto(marco terico) VALIDEZ DE CRTERIO Se basa en algn juicio externo (expertos) VALIDEZ DE CONSTRUCTO Se refiere al grado en que una medicin se relacionaconsistentemente con otras mediciones. En la medidaen que la variable es abstracta y observable se ledenomina de constructo.27 28. El termino confiabilidad es una medida prctica de que tan consistente y estable podra ser un instrumento de medicin o prueba. Existen diversos procedimientos para calcular la confiabilidad de un instrumento de medicin entre los ms utilizados son: Medidas de estabilidad (Test-retest) Mtodo de formas alternativas o paralelas Mtodo de mitades partidas (Split-Halves) Coeficiente alfa de Cronbach Coeficiente KR-20 Kuder y Richardson 28 29. Fuentes de informacin Fuentes primarias: Publican o suministrandatos recogidos por ellas mismas. Fuentes secundarias: Toman datos recogidoso publicados anteriormente por otras.29 30. Tcnicas de Recoleccin de lainformacin ENTREVISTA Requieren Cuestionario estructu Personal Telefnica CUESTIONARIO AUTOADMINISTRADO OBSERVACION Y MEDICION REGISTRO30 31. ENTREVISTA PERSONAL Motiva al entrevistado Alto costo Permite aclarar preguntas Desconfianza dely/o verificar respuestas. entrevistado Alto porcentaje de Longitud limitada (enrespuesta ocasiones) Permite accesar a todos Influencia dellos elementos de la entrevistador puede serpoblacin un elementodistorsionador31 32. ENTREVISTA TELEFONICA Bajo costo Longitud limitada Alto porcentaje de No permite accesar a todosrespuesta los elementos de la Permite verificar las poblacin (no todosrespuestastienen telfono) Ms flexible con respecto ala hora de la entrevista32 33. CUESTIONARIO AUTOADMINSTRADO Porcentaje de respuesta bajo Bajo costo Dificulta la aclaracin de Longitud ilimitadadudas Libertad de respuesta Requiere informantes con Mayor tiempo para nivel educativo altoresponder Requiere un sistema de Permite tratar temascorreo eficientedelicados o embarazosos33 34. OBSERVACION Y MEDICION Neutralidad u objetividad Errores en la observacin Instrumento mal calibrado Instrumento mal utilizado Alto costo en algunos casos No se pueden verificar losdatos34 35. REGISTRO Bajo costo Puede tener informacin Informacin real y objetiva desactualizada oincompleta La informacin disponibleno siempre coincide conlos fines estadsticos.35 36. El Cuestionario Identificacin Prrafo introductorio Tamao Numeracin Caracteres tipogrficos (Tipo de letra, Negrita) Smbolos de ayuda (-->, * ) 36 37. El Cuestionario Clasificacin de las preguntas Cerradas De escogencia nica De escogencia mltiple De rangos De notas Abiertas Abiertas con alguna clasificacin37 38. El Cuestionario Precodificacin Prueba del cuestionario Revisin y Crtica Codificacin Tabulacin38 39. El Cuestionario Longitud del cuestionario Orden o secuencia de las preguntas Iniciales Flujo de los temas Delicadas Estilo de redaccin de las preguntas Clara, comprensible, precisa y lo ms especficaposible. No debe incomodar al entrevistado Debe referirse a un solo aspecto No debe inducir las respuestas 39 40. Fases de una investigacin estadstica Planteamiento del problema. Diseo del instrumento de recoleccin Obtencin de la informacin. Preparacin de la informacin Anlisis e Interpretacin. Presentacin de resultados.40 41. Presentacin de la Informacin Presentacin TextualEn comparacin con 1998, la economa experimenten 1999 una reduccin en la tasa de crecimiento,pues alcanz apenas el 2.5%, mientras que elpromedio anual entre 1985 y 1998 haba sido de4.9%41 42. Presentacin de la Informacin Presentacin semitabularEn el ltimo mes, la mayora de los bancos ha disminuido los interesespara vivienda, como se puede apreciar a continuacin: Se espera que esta reduccin de intereses incentive el sector de la produccin. 42 43. Presentacin tabular: Cuadros Muestran la informacin de forma ordenada porfilas y por columnas, de manera visualmenteagradable. Permiten presentar y divulgar la informacin deuna manera fcil de interpretar y til para elusuario. 43 44. Componentes de un cuadroNmero de cuadroTtuloColumna matrizEncabezadosCuerpo o contenidoNota introductoria o preliminarNota al pieFuente 44 45. Cuadro #TITULO(nota introductoria) Columna Encabezados EncabezadosMatrizCUERPONota al pieFUENTE 45 46. CUADRO 2 CONSUMO DE DROGAS SEGN CANTN DE RESIDENCIA POR TIPO DE DROGA,COSTA RICA, 2,000 (Valores Porcentuales)**Datos preliminaresFUENTE: Consumo de alcohol, tabaco y otras drogas. Distribucin geogrfica 2001. I.A.F.A. 46 47. EXPERIMENTO Actividad planeada cuyos resultadosproducen un conjunto de datos.47 48. PARMETRO Valor numrico que resume toda lainformacin de una poblacin completa. Promedio, moda, mediana, desviacinestndar, rango, etc. 48 49. Una variable es susceptible de medir cualquier caractersticade un objeto que pueda tomar diferentes valores de un conjunto de datos (Un dato es una medida que se realiza sobre los sujetos de un experimento).Existen diferentes tipos de variables, entre las ms utilizadas son:VARIABLES CUALITATIVAS CUANTITATIVAS49 50. Una variable cualitativa, tambin llamada nonumrica, se denomina por sus atributos porqueexpresa distintas cualidades, caractersticas omodalidades, que son susceptibles dedescribirse mediante palabras, cuya medicinsolo puede ser por una escala nominal u ordinal.EJEMPLO: Sexo, estado civil, o la profesin de unapersona. 50 51. TIPOS DE VARIABLES CUALITATIVAS Dicotmicas: Slo hay dos categora, que sonexcluyentes una de la otra Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre Nominal: tiene mas de dos categoras y no hayorden entre ellas. Ejemplo: color de los ojos, grupo sanguneo Ordinal: tiene varias categoras y hay ordenentre ellas. Ejemplo: grado tumoral, calificacin del riesgoen anestesia. 51 52. Una variable cuantitativa, tambin llamada numrica, es aquella susceptible de ser expresada numricamente, cuya medicin puede ser utilizada con una escala de intervalo o de razn segn el objetivo de la investigacin.EJEMPLO: A los pacientes atendidos en la Institucin Musas de Metal se les pregunta el ingreso mensual de susfamilias. $0 a $5,999b) $6,000 a $11,999c)$12,000 a $17,999 d)$18,000 a $23,999 52 53. TIPOS DE VARIABLESCUANTITATIVAS Continuas: nmeros infinito no numerables deelementos. Tiene asociado el concepto demedida Ejemplo: Presin arterial, Edad, peso. Discretas: nmeros finitos o infinitosnumerables de elementos. Se asocia con elconcepto de conteo. Ejemplo: N de hijos, N de casos detuberculosis por estado. 53 54. Hay ocasiones en las que las medidascuantitativas continuas son transformadasen ordinales mediante la utilizacin de unoo varios puntos de corte. Ejemplo: La variable peso es codificada envarias categoras y se utiliza en trminoscomo: Bajo-peso, peso-normal, Sobrepeso,Obesidad54 55. Las descripciones numricas de datos suelen serimportantes. Dado un conjuntode nobservacionesx1 , x2 ,....., xn La estadstica descriptiva nos puede ayudarmediante resmenes numricos, que sonmedidas de tendencia central, o tambinllamadas de posicin y medidas de dispersin55 56. RECOPILACION DE DATOS Es el proceso mediante el cual obtenemoslos datos u observaciones de una muestra. Posteriormente los datos se organizarn deacuerdo al uso que se les de. Experimento, encuesta, censo. 56 57. ORGANIZAR Si se tiene una serie de datos, primero hayque organizarlos en forma ordenada y ensubconjuntos que presenten caractersticassimilares.Los datos agrupados se pueden resumirgrficamente o en tablas y mediantemedidas numricas (parmetros) queobtendremos posteriormente como lamedia, la mediana, la desviacin estndar,etc. 57 58. Los datos ordenados en grupos ocategoras reciben el nombre de:distribucin de frecuencias. Para obtener el rango de una distribucinde frecuencias, se realiza la diferencia entreel mayor y el menor valor de los datos. Cuando se tiene un gran nmero de datos,habr que distribuirlos en : clases, categoras.58 59. La distribucin de datos de frecuencias la cual es lapresentacin de cuadros o tablas estadsticas. El objetivo principal de una distribucin de frecuencias consiste enpresentar los datos de un modo que facilite su comprensin e interpretacin.Algunos tipos de distribucinFrecuencia Absoluta.Frecuencia Relativa.Frecuencia Porcentual.Frecuencia Acumulada.Marca de Clase 59 60. VARIABLE FRECUENCIAABSOLUTA La frecuencia absoluta, es el nmero de AHORRO F veces que se repite un determinado valor 09-12 18o una determinado atributo de la variable. 13-15 26Est influida por el tamao de la muestra, 16-187al aumentar el tamao de la muestra 19-214aumentar tambin el tamao de la 22-241 frecuencia absoluta y la suma de las frecuencias absolutas debe ser igual al 25-274. nmero total de los datos en estudio.Total60 Tabla No 1.3 Datos de laencuesta del ahorro mensual deacuerdo al salario que perciben los trabajadores. (pesosmexicanos)60 61. La frecuencia relativa consiste en la proporcin del nmerototal de datos que aparece en cada intervalo, la suma de la frecuencia es siempre la unidad (1).Se obtiene al dividir la frecuencia absoluta de cada intervaloentre el nmero total de datos o elementos del conjunto.La frecuencia relativa tambin se expresa, en ocasiones, entanto por ciento F Frecuencia del intervaloSE OBTIENE FR = N Suma de frecuencias 61 62. La frecuencia porcentual, consiste encalcular el porcentaje de la relacin queLa palabra porcentajese establece entre una de las partes con significa por cien.respecto al todo multiplicndolas por 100,que pertenece a cada intervalo ocategora.La frecuencia porcentual tambin seexpresa, en ocasiones en frecuenciarelativa. PORCENTAJE = ( F / N ) X 100 PORCENTAJE = FR X 100 62 63. VARIABLE FRECUENCIA FRECUENCIA ABSOLUTA ACUMULADALa frecuencia acumulada, indica cmo AHORROF FAse van concentrando los datos de un09-10 18 18valor de cada intervalo o una13-15 26 44 determinada modalidad del atributo.16-187 51 Puede incluir a cualquiera de las19-214 55frecuencias: absoluta, relativa o22-241 56porcentual; sugiriendo se calcule slo25-274 60la que sea necesaria para los fines dela investigacin.Total 60 Tabla No. 1.6 Datos de laencuesta del ahorro mensual deacuerdo al salario que percibenlos trabajadores. (pesos mexicanos) 63 64. La marca de clase, solo es aplicable a datos agrupados y es: Es el punto medio de cada intervalo de clase. Es el valor que representa a todos los datos que puedan estar integrados en ste.Marca de clase = ( Lmite inferior + Lmite superior ) / 2 9 - 12 10.5 MarcaIntervalos de clasede Clase Con clasificacin continua X64 65. FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA MARCA DEVARIABLE ABSOLUTARELATIVAPORCENTUAL ACUMULADA CLASE AHORROF FR% FAMC 9-12 18 0,330 18 10,513-15 260,4342 441416-1870,1212 511719-2140,07 7 552022-2410,02 2 562325-2740,07 7 6026 Total601100Tabla No. 1.7 Se ha realizado una encuesta a 60 personas alas que se les ha preguntado cuanto dinero ahorranmensualmente de acuerdo al salario que perciben,obtenindose los siguientes resultados (pesos mexicanos)65 66. Las grficas se basa por completo en una tabla de datos y sirvepara visualizar la forma de distribucin de los datos, porque permite mostrar, explicar, interpretar y describir de manerasencilla, clara y efectiva, los datos estadsticos mediante formas geomtricas tales como lneas, reas, volmenes.Para la descripcin grfica, podr disponer de una amplia galerade grficas entre las ms utilizadas son:POLIGONOSHISTOGRAMADEFRECUENCIADIAGRAMA DE OJIVABARRASSECTORIAL 66 67. Se considera uno de las ms sencillas y tiles de representar los datos cuantitativos (numricas) Representa a los niveles de medicin ordinal, de intervalo o de razn Se puede graficar con la frecuencia: absoluta, porcentual relativa, segn los objetivos de la investigacin F Fig. No. 1 Histograma Ahorro (colones) r e30 c20 u10 Cuantitativa e 0 n 1 c9-12 13-15 16-18 19-21 22-24 25-27iaIntervalo67 68. HISTOGRAMATRABAJADORES DEL TALLER ELCTRICO 50TRABAJADORES 42NUMERO E 4027 30 18 edad 2058 10061 6467 70 73EDAD DE LOS TRABAJADORES 68 69. Es una grfica ms utilizada por su sencillez, para representar las caractersticas cuantitativas (numrica) y cualitativas (no numrica) Representa a los niveles de medicin nominal u ordinal Se puede graficar con la frecuencia: absoluta, porcentual o relativa302520 Fig. No. 2 Diagrama de15Barras Percepcin del ahorro10 (colones) 5 0 Baja Muy Regular Alta Muy altabajaCualitativa Categor ia 69 70. Se utilizada para representar principalmente variablescualitativas (no numricas)Representa al nivel de medicin nominalSe puede graficar con la frecuencia: porcentual o relativaResultan adecuado cuando hay pocos valores Para ello se utiliza la siguiente expresin aritmtica:Total de grados = ( porcentaje ) ( 360 ) MUY BAJO Fig. No. 3 Grfica sectorial BAJO REGULARAhorro (dlares) ALTO MUY ALTOCualitativas Porcentajes70 71. Se utiliza para representar principalmente variablescuantitativas (numricas)Representa al nivel de medicin de intervalo o de raznSe puede graficar con la frecuencia: marca de clase Fr 0,50e 0,40cFig. No. 4 Polgono de 0,30uFrecuencia 0,20e0,10Ahorro (euros)n0,00c 9-12 13-15 16-18 19-21 ia22-24 25-2771 72. POLIGONO DE FRECUENCUA TRABAJADORES DEL TALLERELCTRICO TRABAJADORES50NUMERO E404230 27edad201810 8 5 0 61646770 73 EDAD DE LOS TRABAJADORES72 73. Los polgonos de frecuencia pueden emplearseasimismo para representar frecuencia acumuladaque en tal caso resulta designar como ojiva. Es aplicable a variables ordinales. Representa a la distribucin de frecuencias acumuladas, sean absolutas, porcentuales o relativas. Es una grfica ascendente.706050 Fig. No. 5 Ojiva4030 Ahorro (colones)2010 0 9 * 12 13 * 15 16 * 18 19 * 21 22 * 24 25 - 2773 74. CLASE CATEGORIA La utilidad de lo anterior, es que se puedeanalizar con mayor facilidad un conjuntode nmeros sin que se tenga que considerarcada nmero. Una categora o clase recibe el nombre de :intervalo de clase.74 75. INTERVALO DE CLASE Los valores extremos de un intervalo declase reciben el nombre de:limites de clase. (inferior y superior) Existen otros limites de gran importanciallamados limites reales de clase. Para hallar el limite real inferior se suma ellimite inferior mas el nmero anterior yesto se divide entre dos. 75 76. Para hallar el limite real superior se suma ellimite superior mas el nmero que le siguey esto se divide entre dos. Tamao o anchura de clase: basta conrealizar la diferencia entre los limites realesconsiderando primero el superior. Marca de clase: se obtiene sumando loslimites superior e inferior y dividiendoentre dos.76 77. Con la informacin anterior podemosformar las distribuciones de frecuencia conmayor facilidad si consideramos primero elrango. Despus de calcularlo, lo dividimosen un nmero conveniente de intervalos declase del mismo tamao y considerando almismo tiempo que las marcas de clasecoincidan en lo posible con los datos quefueron observados. Por ltimo indicamosla frecuencia de clase.77 78. Al construir una distribucin defrecuenciaspodemos representarlagrficamente, ya sea por medio de unhistograma (rectngulo sobre el eje X) opor un polgono de frecuencias (grficode lnea trazado sobre las marcas de clase)78 79. II semana79 80. DIA 24EJEMPLO 1 Se tiene el nmero de accidentes que ocurrenda a da durante un periodo de 50 das enla autopista Veracruz-Xalapa. 2 9 67082542 4 4 54425673 8 3 84474756 4 7 35173806 1 5 23065636 80 81. Observar que los datos constan de enteros.Puesto que el mayor nmero de accidenteses 9 y el menor es 0, por lo tanto el :rango: 9 0 = 9Considerando 5 intervalos de clase:(Rango + 1)/5 = (9+1)/5=10/5=2 Podemos considerar que cada intervalo declase constar de : 2 elementos. 81 82. 1DIA 15 2DIA 22 Formando los intervalos de clase y contabilizando la cantidad de elementos en cada intervalo de clase obtenemos la siguiente distribucin de frecuencia:INTERVALOS DE CLASEFRECUENCIA 0-15 2-3 11 4-5 16 6-7 13 8-95 Total ( N) = 5082 83. Identificando las partes de la distribucin de frecuencia: Primer intervalo de clase: 0-1 Frecuencia de la tercera de clase: 16 Limite inferior del primer intervalo de clase: 0 Limite superior del tercer intervalo de clase: 5 Tamao de tercera la clase: 5.5-3.5= 2 Marca de la primer clase : (0+1)/2=.5 Marca de la quinta clase : (8+9)/2=8.5 etc. 83 84. FRECUENCIA RELATIVA Es la frecuencia de clase dividida por eltotal de frecuencias de todas las clases. Elresultado se expresa generalmente comoporcentajes. F.R.= f/ N o bien: F.R.%=(f/N) * 100 Esto nos servir para la representacingrfica circular o de pastel. 84 85. FRECUENCIA ACUMULADAS Este tipo de frecuencia est diseada paramostrar el nmero o porcentajes deelementos que son menores que ciertovalor especfico o iguales a este. 85 86. DISTRIBUCION DE FRECUENCIA RELATIVAF.R. (0-1)= 5/50 = 0.10 o bien 10%F.R. (2-3)= 11/50= 0.22 o bien 22%F.R. (4-5)= 16/50= 0.32 o bien 32%F.R. (6-7)= 13/50= 0.26 o bien 26%F.R. (8-9)= 5/50 = 0.10 o bien 10% 1.00100%86 87. DISTRIBUCION DE FRECUENCIA ACUMULADAF.A. (0-1)0.10F.A. (2-3)0.22+0.10=0.32F.A. (4-5)0.32+0.32=0.64F.A. (6-7)0.26+0.64=0.90F.A. (8-9)0.10+0.90=1.00Se puede observar que el 64% de los das no excedi de 5 accidentes y que el 90% de los das no excedi de 7 accidentes.87 88. HISTOGRAMA DEFRECUENCIAS RELATIVASNUMERO DE ACCIDENTES EN LA AUTOPISTA VERACRUZ-XALAPAEN UN PERIODO DE 50 DIASFRECUENCIA 0.40.32 RELATIVA 0.3 0.220.26 0.2Frecuencia 0.10.1 Relativa 0.1 0 0-12-3 4-5 6-7 8-9 RANGO (NUMERO DEACCIDENTES) 88 89. POLIGONO DE FRECUENCIASACUMULADAS NUMERO DE ACCIDENTES EN LAAUTOPISTA VERACRUZ-XALAPA EN1.2 UN PERIODO DE 50 DIASDIAS1 1 FRECUENCIA ACUMULADA0.9 Frecuencia0.8 Acumulada0.60.640.40.320.20.100-1 2-3 4-5 6-7 8-9RANGO (NUMERO DE ACCIDENTES) 89 90. EJEMPLO 2CONSIDEREMOS LA EDAD DE CIEN ADULTOS MAYORES QUE VARIAN ENTRE 60 Y 74 AOS62 72 72 69 69 69 61 68 71 7164 67 64 67 60 64 67 62 64 6765 64 74 64 73 65 63 74 64 6373 64 67 73 71 71 67 65 67 6767 63 63 63 64 71 64 74 71 7170 67 70 66 70 67 70 66 70 6666 68 66 66 69 67 67 68 68 68 68 66 68 70 70 66 67 66 66 7068 68 68 70 67 67 68 68 67 6967 67 67 70 70 70 70 61 70 7090 91. RESOLUCION DE EJEMPLO 2 Rango 74-60= 14 aos Dividiremos todo en cinco intervalos de clase. intervalos de clase (AOS) 60-62 63-65 66-68 69-7172-74 91 92. RESOLUCION DE EJEMPLO 260 Limite inferior del primer intervalo de clase.62 Limite superior de primer intervalo de clase.(59+60)/2 = 59.5 Limite real inferior.(62+63)/2 = 62.5 Limite real superior.Tamao C = 62.5 - 59.5 = 3 C = 65.5 - 62.5 = 3, .., etc.92 93. DISTRIBUCION DE FRECUENCIAS(AOS) ( ADULTOS MAYORES)INTERVALOS DE CLASEFRECUENCIAS60-62 563-65 1866-684269-7127 72-74810093 94. RESOLUCION DE EJEMPLO 2 Marca de Clase(60+62)/2 = 61(63+65)/2 = 64, ., etc 94 95. DISTRIBUCION DEFRECUENCIASAOSADULTOS MAYORESMARCAS DE CLASE FRECUENCIA 615 64 18 67 42 70 27 738N= 10095 96. DISTRIBUCIN DEFRECUENCIA RELATIVA. Distribucin de frecuencia relativa.F. R. (60-62) = 5/100 = 0.05F. R. (63-65) = 18/100 = 0.18 0.42 0.27 0.081.00 96 97. DISTRIBUCIN DE FRECUENCIAS ACUMULADASF.A. (60-62) 0.05F.A. (63-65) 0.18+0.05=0.23F.A. (66-68) 0.42+0.23=0.65F.A. (69-71) 0.27+0.65=0.92F.A. (72-74) 0.08+0.92=1.0097 98. MEDIDAS DE TENDENCIACENTRAL Estas medidas se emplean para indicar unvalor que tiende a ser el ms representativode un conjunto de nmeros. Las tresmedidas de mayor importancia son: Media Mediana Moda 98 99. MEDIA De las 3 medidas est es la ms importante.La media se determina al sumar los valoresde un conjunto y dividir el resultado deesta suma entre el nmero de valores delmismo.X = x1+ x2++xn = nj=1xj = xjN N N99 100. MEDIA Esta medida de tendencia central posee variaspropiedades: Se puede calcular para un conjunto de nmeros La media es nica, es decir, existe una y solo unapara un conjunto de datos. Si cambia algn valor del conjunto de nmeros,entonces tambin cambia la media. La suma de desviaciones de los nmeros a partirde la media es 0.(xj-X) = 0100 101. MEDIA Cuando se tiene una tabla de una distribucin defrecuencias en donde hemos clasificado nuestrosdatos y deseamos calcular la media tenemos queconsiderar nicamente las marcas de clase decada intervalo. Estas marcas de clasemultiplicadas por las frecuencias y divididasentre la frecuencia total, nos da como resultadola media. X = f1x1+ f2x2++fkxk = kj=1fjxj = fxjN NN101 102. EJEMPLO 3 En un examen de habilidad matemtica aplicadoa 25 alumnos se les pidi completar en formaindividual un cuadro mgico. El tiempo quenecesit cada estudiante para completar eltrabajo fue registrado en minutos . Losresultados fueron los siguientes:Minutos x 1 2 3 4 5 6 7Alumnos f 1 2 3 0 4 6 9102 103. HALLANDO LA MEDIAX = f1x1+ f2x2++fkxk = kj=1fjxj = fxj NN NX = 1(1)+2(2)+3(3)+0(4)+4(5)+6(6)+9(7)= 133= 2525X= 5.32 min. 103 104. MEDIANA La caracterstica de mayor importancia esque divide un conjunto ordenado en dosgrupos iguales, es decir, la mediana de unconjunto de datos ordenados en orden demagnitud, es el valor medio o la media delos valores medios. Una regla para obtener la mediana es: Clasificacin u ordenamiento de los datos.104 105. MEDIANA Contar para conocer si existen un numeropar o impar de datos. Si se tiene un numero impar de valores, lamediana es el valor intermedio. Para unnumero par de valores, la mediana es lamedia de los valores intermedios.105 106. MEDIANA Considerando una distribucin de frecuencias para datosagrupados, la mediana se obtiene mediante:Mediana = L1 + N/2 (F )1C Fmediana Donde: L1 = Limite real inferior de la clase mediana (esto es, la clase quecontiene la mediana). N = Frecuencia Total (Numero total de Datos) (f)1=Suma dde las frecuencias de todas las clases que seencuentran debajo de la clase mediana. Fmediana = Frecuencia de la clase mediana C= Tamao del intervalo de la clase mediana. 106 107. EJEMPLO 4 En un examen de habilidad matemtica aplicadoa 25 alumnos se les pidi completar en formaindividual un cuadro mgico. El tiempo quenecesit cada estudiante para completar eltrabajo fue registrado en minutos . Losresultados fueron los siguientes:Minutos x 1 2 3 4 5 6 7Alumnos f 1 2 3 0 4 6 9107 108. HALLANDO LA MEDIANA Mediana = L1 + N/2 (F )1 c FmedianaRecuerde que grficamente la mediana es el valor quecorresponde a la mitad de la frecuencia total.25/2= 12.5 = N/2La de la f hasta la quinta clase es 10 : (F )1La de la f hasta la sexta clase es 16En esta clase se localiza la mediana.Clase mediana : sexta clase 108 109. HALLANDO LA MEDIANALimite real inferior de la sexta clase:L1 = (5+6)/2= 5.5(F )1= 10 Mediana: 5.5 + 12.5-10 (1)Fmediana = 6 6C= 1 Mediana=5.5 +0.416 = 5.916N/2= 12.5 min.109 110. MODA La moda es el valor que mayor nmero deveces se presenta en un conjunto denmeros. Existen algunos casos en loscuales no existe la moda y otros en loscuales existen mas de una moda. Unadistribucin que cuenta con una moda se leconoce como unmodal.110 111. MODA Para una distribucin de frecuencias, la moda es el valor o losvalores mximos de la curva y se puede calcular por medio deModa = L1 + 1C 1 + 2 Donde: L1 = Limite real inferior de clase de la clasemodal. La clasemodal es aquella donde se localiza la moda. 1 = Es la diferencia entre la frecuencia de la clase modal y lafrecuencia anterior o premodal 2 = Es la diferencia entre la frecuencia de la clase modal y lafrecuencia siguiente o posmodal C = Tamao del intervalo de clase modal111 112. EJEMPLO 5 En un examen de habilidad matemtica aplicadoa 25 alumnos se les pidi completar en formaindividual un cuadro mgico. El tiempo quenecesit cada estudiante para completar eltrabajo fue registrado en minutos . Losresultados fueron los siguientes:Minutos x 1 2 3 4 5 6 7Alumnos f 1 2 3 0 4 6 9Moda: 7 min.112 113. EJEMPLO MEDIDAS DETENDENCIA CENTRAL En una compaa automotriz hay 100trabajadores los cuales producenrefacciones. Algunos por sus capacidades yexperiencias construyen mas que otros altermino de cada mes. La distribucin defrecuencias es la siguiente: 113 114. Intervalo de Clase Frecuencia(f)x45-472 4648-504 4951-53155254-56215557-59395860-62 56163-651464114 115. MEDIA, MEDIANA Y MODAMEDIA X =56.86 refacciones producidasMEDIANA =57.11 refacciones producidasMODA= 57.53 refacciones producidas115 116. MEDIAPromedio aritmtico del conjunto de datos.Un dato extremo disperso afecta alresultado de la media.116 117. MEDIANAEs el nmero del medio del conjunto dedatos, establece un punto que divide alconjunto de datos en dos grupos de lamisma cantidad.117 118. MODA Es el nmero ms popular en el conjunto de datos.Es importante saber la marca de cereales que se vende ms de manera que se pueda estar seguro de tener suficiente en el almacn.118 119. MEDIA Y MEDIANAPara un conjunto de datos con dos o msmodas, ser mejor usar la media o lamediana como caracterstica del grupo,recordando que al haber un extremodisperso, es mejor el uso de la mediana. 119 120. EJEMPLO 6Una persona que sirve mesas en elrestaurante del hotel PLAZAVERACRUZ de Veracruz, Veracruz,registra las propinas que percibi durante 7das.Da1 234 567$2415 22 8016 21 19 120 121. ANALISISCunto te haces de propina en un da?X = $ 28.14Moda : no hayMediana: 15,16,19,21,22,24,80 = $ 21Cul seria el valor ms caracterstico orepresentativo de este conjunto de datos?121 122. EJEMPLO 7 Datos de produccin de tres operarios. Nmero de artculos producidos por da Da de trabajoOperario da 1 da 2 da 3 da 4 da 5 da 6 da 7 da 8 da 9 da 10 A 12 23 345 455 B 61 25 3 222 71 C 76 54 2 323 22122 123. MODA MEDIA MEDIANAOPERARIO A5 3.53.4OPERARIO B2 2.53.2OPERARIO C2 33.6Qu operario elegiras para quecontinuara en el puesto?Te ayudara el rango a reafirmar tudecisin? Qu mas observas? 123 124. MEDIDAS DE DISPERSION Este tipo de medidas tambin reciben el nombrede Medidas De Variacin. Las Medidas de Dispersin o Variacin seemplean para saber si los valores estnrelativamente cercanos uno al otro o si seencuentran dispersos. Todas las medidas dedispersin exceptuando la de Amplitud o Rangotoman a la media como punto de referencia.124 125. MEDIDAS DE DISPERSIONLas medidas de dispersin son: 125 126. RANGO O AMPLITUD DE VARIACION Es la diferencia entre el mayor valor y elmenor de todos ellos. El rango es una medida limitada puestoque considera a los valores extremos de unconjunto y no proporciona mayorinformacin respecto a los dems valoresdel mismo.126 127. DESVIACION MEDIA OPROMEDIO DE DESVIACION Se emplea para medir el promedio de losalejamientos de los datos observados en lamuestra respecto a la media de estos datos. Para un conjunto de valores se obtiene al restarla media de cada valor del grupo, eliminando elsigno negativo (esto se logra por medio del valorabsoluto) dividida entre el nmero total deobservaciones. 127 128. DESVIACION MEDIA OPROMEDIO DE DESVIACION Sus formulas son:Para una distribucin de frecuencias: DM = x-XDM = f x-XN N N = numero total de datos. x = Marcas de clase X = Media f = frecuencias de clase 128 129. VARIANZA La varianza de una muestra se determina enforma similar que la desviacin media pero conlas siguiente diferencia:Las desviaciones se elevan al cuadrado antes deser sumadas. 129 130. VARIANZA Sus formulas son: Para una distribucinde frecuencias S2 = (x-X)2 S2 = f (x-X)2 N N Donde: N = numero total de datos. x = Marcas de clase o datos X = Media f = frecuencias de clase130 131. DESVIACION ESTANDAR La desviacin estndar es la raz cuadradapositiva de la varianza. Para obtener ladesviacin estndar se debe calcular la varianza yhallar su raz cuadrada positiva. La desviacin estndar queda representada porla letra mayscula S. La desviacin estndar es una de las medidasmas importantes dentro de la Estadstica.131 132. DESVIACION ESTANDAR Sus formulas son: Para una distribucinde frecuencias S=Donde: (x-X)2N S=f (x-X)2 N N = numero total de datos. x = Marcas de clase o datos X = Media f = frecuencias de clase132 133. DESVIACION ESTANDAR El 68% de los valores cae dentro del rango de una vezla desviacin estndar con respecto de la media. En cualquier conjunto de valores graficados que seajusten a una curva normal, el 95% de los valoresquedan dentro de dos desviaciones tpicas respecto delvalor de la media del conjunto. Generalmente en un rango de 3 desviaciones tpicascon respecto a la media queda contenido el 100% delos valores del conjunto. Esta informacin tiene usoinmediato en la aplicacin de tolerancia o medidas decontrol de calidad de artculos manufacturados.133 134. REPRESENTACION DE LADESVIACION ESTANDAR LA MEDIA, LA MODA Y LA MEDIANA SON IGUALESPUNTOS DEINFLEXIONPUNTOS DE 68 %INFLEXIONUNA DESVIACIONTPICA O ESTANDARDOS DESVIACIONES TPICAS O ESTANDAR134 135. EJEMPLO DE MEDIDAS DE DISPERSION En un experimento aleatorio se obtuvo lamuestra de elementos:17, 15, 25, 23, 18, 18, 20, 19, 20, 20, 20, 21, 20,20Determinar Desviacin Media Varianza Desviacin estndar.135 136. OBTENIENDO LA DISTRIBUCION DEFRECUENCIAS x f f.x15 1 1517 1 1718 2 3619 1 1920 612021 1 2123 1 2325 1 25N = 14fx= 276 136 137. MEDIAMedia = fx / N = 276/14 = 19.714137 138. x media Desvx-X FF.x-X 15 19.7142857 4.714285714.7142857 17 19.7142857 2.714285712.7142857 18 19.7142857 1.714285723.4285714 19 19.7142857 0.714285710.7142857 20 19.7142857 0.285714361.7142858 21 19.7142857 1.285714311.2857143 23 19.7142857 3.285714313.2857143 25 19.7142857 5.285714315.2857143 N= F.x-X =14 23.1428572 138 139. DESVIACION MEDIADESV. MEDIA 1.65306123 139 140. CALCULO DE LA DESV. ESTANDAR Y LAVARIANZADesviacinx-X (x-X)2ff(x-X)2 4.7142857 22.2244897 122.2244897 2.7142857 7.36734686 17.36734686 1.7142857 2.93877546 25.87755092 0.7142857 0.51020406 10.51020406 0.2857143 0.08163266 60.48979597 1.2857143 1.65306126 11.65306126 3.2857143 10.7959185 110.7959185 5.2857143 27.9387757 127.9387757 f(x-X)2 =N = 1476.8571429140 141. DESVIACION ESTANDAR Y VARIANZAvarianza5.48979592Desv. Estandar2.340309 141 142. CUARTILES, DECILES Y PERCENTILES. Los cuartiles, deciles y percentiles se asemejenmucho a la mediana porque tambin subdividenuna distribucin de mediciones de acuerdo conla proporcin de frecuencias observadas yordenadas. Mientras la mediana divide una distribucin endos mitades, los cuartiles la dividen en cuatrocuartos, los deciles la dividen en 10 dcimos ylos puntos percentiles la dividen en 100 partes. 142 143. Considerando que el lugar de la mediana sepuede encontrar por:Lugar de la mediana: n/2 + Para el primer cuartil ser: n/4 + Para el tercer decil ser: 3n/10 + Para el septuagsimo percentil ser: 70n/100 + 143 144. EJEMPLO Si ocho empresas vendieron las siguientescantidades de unidades de aire acondicionado, 5,8, 8, 11, 11, 11, 14, 16.Busque la posicin del tercer cuartel para estadistribucin; C3 = 3n/4 + C3 = 3(8)/4 + = 6.5 Lo cual nos indica que el tercer cuartel seencuentra ubicado entre el sexto y sptimo valordel grupo ordenado. O sea: (11 + 14)/ 2 = 12.5 144 145. DESVIACION CUARTIL Es la medida de dispersin ms usada enrelacin con la mediana; tambin es llamadarango semiintercuartil. Se simboliza por Q yse le define por la frmula: en la cual Q1 y Q3 son los puntos bajo loscuales se halla el 25% y el 75% de los datos,respectivamente, como ya se haba vistoanteriormente.145 146. 146