conceptos en estadistica

23
Estadística y Probabilidad I Conceptos en Estadística Ciclo escolar 2014-2015

Upload: artemio-villegas

Post on 12-Dec-2015

25 views

Category:

Documents


0 download

DESCRIPTION

Diapositivas del curso de Estadística y Probabilidad I de la PrepaUVAQ

TRANSCRIPT

Estadística y Probabilidad I

Conceptos en Estadística

Ciclo escolar 2014-2015

Definición de Estadística.

• La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos.

• Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.

La estadística se divide en dos grandes áreas:

• La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.

La estadística se divide en dos grandes áreas:

• La estadística inferencial, se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.

Origen de la Estadística.

• El término alemán Statistik, introducido originalmente por Gottfried Achenwall en 1749, se refería al análisis de datos del Estado, es decir, la “Ciencia del Estado” (o más bien, de la ciudad-estado).

• También se llamó “aritmética política” de acuerdo con la traducción literal del inglés. No fue hasta el siglo XIX cuando el término estadística adquirió el significado de recolectar y clasificar datos. Este concepto fue introducido por el militar británico Sir John Sinclair (1754-1835).

Origen de la Estadística.

• En su origen, por tanto, la Estadística estuvo asociada a los Estados o ciudades libres, para ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La colección de datos acerca de estados y localidades continúa ampliamente a través de los servicios de estadística nacionales e internacionales. En particular, los censos comenzaron a suministrar información regular acerca de la población de cada país. Así pues, los datos estadísticos se referían originalmente a los datos demográficos de una ciudad o estado determinados. Y es por ello que en la clasificación decimal de Melvil Dewey, empleada en las bibliotecas, todas las obras sobre estadística se encuentran ubicadas al lado de las obras sobre la demografía.

Criticas a la Estadística.

• Hay una percepción general de que el conocimiento estadístico es intencionado y frecuentemente mal usado, encontrando maneras de interpretar los datos que sean favorables al presentador.

• Un dicho famoso, al parecer de Benjamin Disraeli es: «Hay tres tipos de mentiras: mentiras pequeñas, mentiras grandes y estadísticas».

• El popular libro How to lie with statistics (Cómo mentir con las estadísticas en la edición española) de Darrell Huff discute muchos casos de mal uso de la estadística, con énfasis en gráficas malintencionadas. Al escoger (o rechazar o modificar) una cierta muestra, los resultados pueden ser manipulados.

How to lie with statistics

• La tasa de natalidad es el doble que la tasa de mortalidad; por lo tanto, una de cada dos personas es inmortal.

• El no tener hijos es hereditario; si tus padres no tuvieron ninguno, lo más probable es que tu tampoco los tengas.

• La probabilidad de tener un accidente de tráfico aumenta con el tiempo que pasas en la calle. Por lo tanto, cuanto mas rápido circules, menor es la probabilidad de que tengas un accidente.

How to lie with statistics

• En Nueva York un hombre es atropellado cada diez minutos. El pobre tiene que estar hecho polvo.

• El 33 % de los accidentes mortales involucran a alguien que ha bebido. Por lo tanto, el 67 % restante ha sido causado por alguien que no había bebido. A la vista de esto y de lo anterior, esta claro que la forma más segura de conducir es ir borracho y a gran velocidad.

• La probabilidad de que en un avión haya una bomba es de una entre mil y la de que haya dos, es una entre cien mil. Consejo: Viaja siempre con una bomba a cuestas.

Recolección de Datos.

La recolección de datos se refiere al uso de una gran diversidad de técnicas y herramientas que pueden ser utilizadas por el analista para desarrollar los sistemas de información. Todas estos instrumentos se aplicará en un momento en particular, con la finalidad de buscar información que será útil a una investigación en común.

Técnicas de recolección de datos.

• Los analistas utilizan una variedad de métodos a fin de recopilar los datos sobre una situación existente. Cada uno tiene ventajas y desventajas. Generalmente, se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigación completa. las principales técnicas de recolección de datos son:

• Entrevista.• Observación.• Encuesta.• Sesión de Grupo.

La entrevista.

• Las entrevistas se utilizan para recabar información en forma verbal, a través de preguntas que propone el analista. Quienes responden pueden ser gerentes o empleados, los cuales son usuarios actuales del sistema existente, usuarios potenciales del sistema propuesto o aquellos que proporcionarán datos o serán afectados por la aplicación propuesta. El analista puede entrevistar al personal en forma individual o en grupos. Sin embargo, las entrevistas no siempre son la mejor fuente de datos de aplicación.

La observación.

• Otra técnica útil para el analista en su progreso de investigación, consiste en observar a las personas cuando efectúan su trabajo. Como técnica de investigación, la observación tiene amplia aceptación científica. Los sociólogos, psicólogos e ingenieros industriales utilizan extensamente ésta técnica con el fin de estudiar a las personas en sus actividades de grupo y como miembros de la organización. El propósito de la organización es múltiple: permite al analista determinar que se está haciendo, como se está haciendo, quien lo hace, cuando se lleva a cabo, cuanto tiempo toma, dónde se hace y por que se hace.

• "¡Ver es creer! " Observar las operaciones le proporciona al analista hechos que no podría obtener de otra forma.

La encuesta.

• Una encuesta es un conjunto de preguntas normalizadas dirigidas a una muestra representativa de la población o instituciones, con el fin de conocer estados de opinión o hechos específicos.En la actualidad, existen al menos cuatro tipos de encuesta que permiten obtener información primaria, por lo que es imprescindible que investigadores de mercados y mercadólogos conozcan cuáles son y en qué consiste cada uno de ellos.

• Encuestas basadas en entrevistas cara a cara o de profundidad• Encuestas telefónicas.• Encuestas postales.• Encuestas por Internet.

Sesión de grupo.

• Un método desarrollado recientemente para recolectar ideas e información valiosa son las sesiones de grupo. En una sesión de grupo un pequeño número de individuos es reunido para conversar acerca de algún tema de interés para alguna compañía, institución o persona. La reunión, que dura aproximadamente una hora, es dirigida por un moderador el cual asegura que en la sesión se discutan los temas deseados y que se formen discusiones acerca de las ideas planteadas por los participantes.

Tipos de variables.

• Una variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores.

• Los métodos estadísticos que usamos dependen del tipo de variable.

• Existen diferentes tipos de clasificación de variables, pero por el momento las estudiaremos según su medición o forma de medir:

• Variables Cualitativas.• Variables Cuantitativas.

Variables Cualitativas.

• Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría, y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y no, hombre y mujer o ser politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:

• Ordinales• Nominales

Variables Cualitativas.

• Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, fuerte.

• Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden, como por ejemplo los colores.

Variables Cuantitativas.

• Son las variables que toman como argumento, cantidades numéricas, son variables matemáticas. Las variables cuantitativas además pueden ser:

• Discretas

• Continuas

Variables Cuantitativas.

• Variable cuantitativa discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).

• Variable cuantitativa continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría permiten que exista un valor entre dos variables.

Actividad 1

1. Identifica el tipo de variable, si es cualitativa ordinal, cualitativa nominal, cuantitativa discreta o cuantitativa continua.

2. Agrega en la parte final tres ejemplos de cada tipo de variable que no este enunciada en la lista.

Actividad 11. Comida favorita.2. Profesión que te gusta.3. Número de goles marcados por

tu equipo favorito.4. Números de alumnos de la

PrepaUVAQ.5. El color de los ojos de tus

compañeros de clases.6. Coeficiente intelectual.7. Litros de agua en un deposito.8. Suma de puntos obtenidos en

el lanzamiento de un par de dados.

9. Área de una pared que será próxima a pintar.

10. Cantidad de amigos.

11. Numero de acciones vendidas cada día en la bolsa.

12. Nacionalidad de una persona.13. Temperaturas registradas cada

hora en un laboratorio.14. Estado civil.15. Kilometraje de un automóvil.16. Cantidad de libros en la

biblioteca.17. Números de hijos de las familia

en tu colonia.18. Resultados del ultimo censo de

población y vivienda.19. Talla de zapatos.20. La altura de tus amigos.

Tipos de Muestreo

Muestreo

Probabilístico

Aleatorio Simple

Aleatorio Sistemático

Aleatorio Estratificado

No probabilístico