estadística computacional 0. introducción ricardo Ñanculef alegría universidad técnica federico...

Post on 28-Jan-2016

238 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Estadística Computacional0. Introducción

Ricardo Ñanculef AlegríaUniversidad Técnica Federico Santa María

Porqué Estadística?

Porqué Estadística?

Cómo interpretamos esta estadística??

(a) ¿Qué significa prevalencia?(b) ¿Cuál es la muestra?(c) ¿Cuál es el crecimiento natural de la población en Chile?

Porqué Estadística?

3,7 3,94,7

5,65,0 5,3

7,0

0

1

2

3

4

5

6

7

8

9

10

1994 1996 1998 2000 2002 2004 2006

Evolución del Consumo de Marihuana según estudio del CONACE

Porqué Estadística?

Tendencia de la Percepción de Riesgo en el consumo habitual de Marihuana y Cocaína según estudio del CONACE

74 7262

81 82 81

0

20

40

60

80

100

2002 2004 2006

Perc. de Riesgo MARIHUANA Perc. de Riesgo COCAÍNA

Porqué Estadística?

Porqué Estadística?

Relación causa-efecto: estrés → aumento de la muerte fetal

(a) Cómo se valida una conclusión de esta naturaleza? (b) Se han descartado otras variables? Cigarrillo? Edad?(c) Qué tan significativo es el contraste de la dos muestras?

(a) Simulemos 100 pacientes: 37 casos de muerte fetal y 63 casos de ausencia de muerte fetal (36.5% muerte fetal marginal)

(b) Seleccionamos aleatoriamente un grupo de tamaño 33 y otro de tamaño 67 (33% estrés observado)

(c) Diferencias en las tasas de muerte fetal

Grupo 1 Grupo 2 Selección aleatoria 1: 38% 36% Selección aleatoria 2: 34% 40% Selección aleatoria 3: 32% 39% Selección aleatoria 4: 41% 34% Selección aleatoria 5: 37% 38%

Hagamos un experimento casero …

Grupo 1 Grupo 2

Selección aleatoria 1: 38% 36% Selección aleatoria 2: 34% 40% Selección aleatoria 3: 32% 39% Selección aleatoria 4: 41% 34% Selección aleatoria 5: 37% 38%

Puede ser aleatoria la diferencia observada por los científicos daneses? Independiente de la respuesta, Cuidado con la significancia de las diferencias: una diferencia del 7% es perfectamente aleatoria!!

Resultados del experimento casero …

Estadística: Fundamental para comprender mucha de la información que recibimos a diario y comunicar información de manera efectiva

Estadística: El 99% de las decisiones que se toman en el mundo dependen las conclusiones que se puedan obtener de una muestra

Estadística: Aceptar una innovación en un escenario con incertidumbre en un pasa por conseguir un argumento estadístico que soporte su conveniencia

Qué es la Estadística?

wikipedia.org:

La estadística es una rama de la matemática que se refiere a la recolección, estudio e interpretación de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales (…) y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales.

Estadística: Conjunto de herramientas para tomar y analizar datos de manera de obtener información acerca de un fenómeno sobre el que existe incertidumbre

Qué es la Estadística? Dos conceptos fundamentales: muestra y población

• Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones• Muestra: subconjunto de la población que se extrae para ser estudiado

Qué es la Estadística? Dos conceptos fundamentales: muestra y población• Población Muestral o Marco Muestral: conjunto de elementos de la población suceptible de ser muestreada. Ejemplo:

Qué es la Estadística? Dos conceptos fundamentales: muestra y población

• Población Objetivo?• Marco Muestral?• Muestra?

Estadística: Set de herramientas para análisis (?) de datos. • Estadística Descriptiva: métodos de recolección, descripción, visualización y resumen de datos.Explicar qué ocurre la muestra.

• Estadística Inferencial: formulación de modelos explicativos o prospectivos.

• Generalizar hacia la población muestral.• Proyectar una variable en el tiempo. • Validez de las generalizaciones y proyecciones.

Estadística Descriptiva¿Cómo recolectar los datos?

Estadística Descriptiva¿Cómo recolectar los datos?

Estadística Descriptiva¿Cómo organizar y presentar los datos?

Estadística Descriptiva¿Cómo resumir los datos?

• niveles medios• tendencias • variabilidad• rangos

Las variables son variables: cómo dar cuenta de ellas de manera compacta

La Estadística Descriptiva se ocupa de cómo recolectar datos y presentarlos de manera informativa

Inferencia Estadística¿Cómo generalizar desde los datos?

• Formulando modelos de cómo las variables cambian, que den cuenta de su aleatoriedad o incertidumbre

• Ejemplo: Distribución de Poisson: Poi(λ)

Inferencia EstadísticaNaturaleza de un Modelo

• Marcos conceptuales que ayudan a entender un fenómeno representándolo de manera simplificada• Exactitud o validez de un modelo• Más que verdadero útil

Inferencia Estadística¿Cómo generalizar desde los datos?

• Los modelos estadísticos nos ayudan a ordenar fenómenos que parecen no tener orden o causa clara

• Nos ayudan a modelar la incertidumbre inherente a la mayoría de los sistemas complejos: grandes grupos de personas, sistemas financieros, la biosfera, el macro mundo como emergencia del mundo atómico

• Por lo tanto nos ayudan a decidir bajo un escenario de incertidumbre

Inferencia Estadística¿Cómo generalizar desde los datos?

Un Modelo Estadístico Simple:Sea X la distancia (m) a la que se acerca el mar de una línea de referencia segura. Medimos X en varias oportunidades:

S = {15, 12, 10, 10, 12, 8, 10, 4, 4, 2, 3, 4, 10, 10, 12, 15, 14, 12, 12, 1, -0.5, 0.5,12, 10, 8, 5, 5, 1}

*Olas en la costa de Donostia (San Sebastián), en el País Vasco.

Inferencia Estadística¿Cómo generalizar desde los datos?

Un Modelo Estadístico Simple:Sea X la distancia (m) a la que se acerca el mar de una línea de referencia segura

1. X < 0.1m el 1% del tiempo2. 0.1 < X < 2m el 5% del tiempo3. 2 < X < 4m el 30% del tiempo4. X > 4 el 64% del tiempo

* Nilómetro

Inferencia Estadística¿Cómo generalizar desde los datos?

Modelo Estadístico de ServicioSea T el tiempo que pasa entre que dos votantes son atendidos. Notamos que en 1 hora votan más o menos 20 personas y que T > T0 = 1 minuto

)(40 0

401

)( TtetP

Probabilidad de T = t

*Elecciones 2006 en Venezuela

Inferencia Estadística¿Cómo generalizar desde los datos?

• Formulando modelos• Formulando hipótesis acerca de la población y contrastando su validez

¿Cuál es la Hipótesis?¿Cómo la escribimos?

Inferencia Estadística

Si X mide la comprensión lectora en la población de niños que ven (T) mucha televisión (1) versus una cantidad moderada (2)

(Hipótesis A) X1 < X2

(Hipótesis B) X1 ≠ X2

(Hipótesis C) X = 10 – alpha*T

Estadística Análisis de Hipótesis y Modelos

• Cuál es la validez de los modelos e hipótesis más allá de las muestras sobre las que podemos medir • Consistencia muestral ≠ validez poblacional• Significancia de las hipótesis o modelos

• Es foco de la estadística dar cuenta de las simplificaciones inherentes a los modelos? Sí y no: sensibilidad a los modelos estadísticos

La Estadística Inferecial construye modelos e hipótesis que expliquen la variabilidad inherente a las observaciones

Estadística: Perspectiva Histórica

• del latín statisticum collegium ("consejo de Estado"), de su derivado italiano statista ("político") ó del alemán staat (“gobierno”).• Presente en todas las sociedades organizadas como herramienta administrativa (estudios demográficos, de renta, de productividad, de potencia bélica)• Nace con los censos de población y bienes

Estadística: Perspectiva Histórica

~

Censo del Pueblo de Israel1300 AC.

Estadística: Perspectiva Histórica

~

Censo del Pueblo de Israel1300 AC.

Estadística: Perspectiva Histórica • Siglo XIX: nace la estadística matemática

Estadística: Perspectiva Histórica • Fines del Siglo XX: Análisis Inteligente de Datos• Volúmenes gigantescos de datos, sin precedentes: observatorios, proyecto genoma, la web. • Análisis manual?: Estadística automatizada• Búsqueda de patrones en gigantescos volúmenes de datos: modelos estadísticos más algoritmos informáticos

Fobia a la Estadística?

Fobia a la Estadística?

Propósito número 1 de este curso:No más fobia a la estadística!

Propósito número 1 de este curso:No más fobia a la estadística!

• La estadística es muy sencilla si se aprenden bien los conceptos base.

• No se pide mucho:• Atención en clases.• Estudio en casa: unas hrs. A la semana bastan! • lr a la Ayudantía.

Forma de Evaluación

• 2 certámenes (60%)• 1 nota de controles (15%)• 1 nota de laboratorio (25%) se exige aprobación• 1 exámen (eximición con 65)

top related