com sobreviure a una estadística científica
DESCRIPTION
Com sobreviure a una estadística científica. Xavier Basagaña Setmana de la Ciència 2013. Estadística. Ciència o un conjunt d’eines per resumir informació. Estadística. Hipòtesi. Experiment. Eina fonamental en la ciència. Refutació. Suport. Quantificació del resultats: estadística. - PowerPoint PPT PresentationTRANSCRIPT
Com sobreviure a una estadística científica
Xavier BasagañaSetmana de la Ciència 2013
Estadística• Ciència o un conjunt d’eines per resumir informació.
• Ens ofereix la possibilitat de testar si determinats fenòmens segueixen algun patró que puguem identificar, o es poden atribuir a l’atzar.
Estadística
Hipòtesi
Experiment
Suport Refutació
Eina fonamental en la ciència
Quantificació del resultats: estadística
Estadística
• Exemples:– Tinc una molècula que crec que pot funcionar com a
tractament d’una malaltia.– He dissenyat una bateria que crec que dura més que
les existents.– He descobert un material més resistent que els que
es feien servir en un determinat producte.– Crec que he descobert la zona del cervell que
controla una certa funció– ...
Per què la teoria no és suficient?
• Si les propietats químiques d’un compost ens diuen que cura una malaltia, per què cal recórrer a l’estadística?– Sistemes biològics molt complexos (mai es podrà
controlar tot).• En determinades persones pot funcionar i en altres no.• Diferents graus de curació.• Interacció amb altres substàncies• ...
Calen experiments
MESURES ESTADÍSTIQUES UTILITZADES HABITUALMENT
MESURES DESCRIPTIVES
Mesures descriptives
• Resumeixen una informació. Fàcils d’entendre.
• Proporcions:
– Proporció de fumadors: 25%
– Proporció que presenten efectes secundaris: 0.1%
– Percentatge de peces defectuoses en un procés de producció: 0.001%.
Mesures descriptives
• Mitjanes:
– Salari brut anual, mitjana: 22.899 €.
– Nivells de contaminació atmosfèrica (PM10) a Barcelona: 40 µg/m3.
– Nivells mitjans de colesterol: 210 mg/dL
– Mitjana de cotxes per habitant: 0.47.
Mesures descriptives
Mesures descriptives
• Tot i ser fàcils d’entendre, sempre hi ha perill a l’hora d’interpretar les dades.– Exemples (no científics): eleccions, EGM.
• Determinats gràfics poden induir conclusions errònies.
Mesures descriptives
MESURES D’ASSOCIACIÓ
Mesures d’associació
• Associació entre 2 variables (causa-efecte):
Variable explicativa
Variable resposta
Variables confusores
Alcohol Malaltia
Tabac
Mesures d’associació
• Associació entre 2 variables (causa-efecte):
Variable explicativa
Variable resposta
Variables confusores
Emissió de gasos
Augment de temperatures
Cicles Naturals
Mesures d’associació
• Associació entre 2 variables (causa-efecte):
Variable explicativa
Variable resposta
Variables confusores
Prendre un medicament Curació
Característiques del pacient
Mesures d’associació
• Associació entre 2 variables (causa-efecte):
Variable explicativa
Variable resposta
Variables confusores
Nivell d’estudis Estar a l’atur
Edat
VARIABLES CONTÍNUES
Com es quantifiquen les associacions
• 2 variables contínues (associació lineal)
Com es quantifiquen les associacions
• 2 variables contínues (associació lineal):
Reduir el consum de sodi als 25 anys de 150 mmol/dia a 50 mmol/dia, implica una reducció de
9 mm Hg en la pressió sistòlica als 55 anys.
Com es quantifiquen les associacions
• 2 variable contínues (corbes)
Esperança de vida = 10.754 + 6.6354*log(PIB per capita)
Com es quantifiquen les associacions
• 2 variable contínues (corbes)
• Les associacions multiplicatives es poden resumir de forma entenedora amb un sol número:– Ex: Al doblar el PIB, l’esperança de vida augmenta
4.6 anys (6.6354*log(2)).• Amb corbes més complicades, una bona idea podria ser
agafar 2 punts interessants de l’eix X i donar l’increment en Y.
Esperança de vida = 10.754 + 6.6354*log(PIB per capita)
VARIABLES CATEGÒRIQUES
Com es quantifiquen les associacions
• Quan la resposta (l’efecte) és sí/no.• Models per la probabilitat (risc).• Exemples:
– Probabilitat de curar-se.– Probabilitat (risc) de morir.– Probabilitat d’acabar els estudis.– Probabilitat d’error en un procés industrial.– Probabilitat que un client compri un producte.
Com es quantifiquen les associacions
• En ciències de la salut és molt comú fer servir el risc relatiu (RR).
2 grup malaltia la deat probabilit1 grup malaltia la deat probabilit
RR
• Exemple: risc en fumadors 10%, risc en no fumadors 4%.– RR = 0.1/0.04 = 2.5– RR> 1 Fumar és un factor de risc.
• Exemple: risc en els que fan activitat física 2%, risc en els que no, 8%.
– RR = 0.02/0.08 = 0.25.– RR<1 Activitat física és un factor protector.
• Exemple: risc en homes 5%, risc en dones 5%.– RR = 0.05/0.05 = 1 No hi ha associació entre la malaltia i el sexe.
Com es quantifiquen les associacions
• En ciències de la salut es fan servir altres mesures de risc relatiu:– Risc relatiu (RR)– Odds ratio (OR) *– Hazard ratio (HR)
• Totes es poden interpretar com:– Aquest grup té x% més risc que l’altre– A mesura que augmenta la variable explicativa, el risc augmenta
x%
* interpretable com a RR només si d’una malaltia que afecta <10% de la població, si no molt difícil d’interpretar.
Ratio vs. percent change
• Exemples: – OR = 1.06 increment del 6% en el risc.– RR = 1.20 increment del 20% en el risc.– HR=2 increment del 100% en el risc, o el risc es dobla.– RR= 5 es té 5 vegades més risc.
Ratio Canvi percentual (percent change)
RR (RR-1)*100 %OR (OR-1)*100 %HR (HR-1)*100 %
Com es quantifiquen les associacions
• Exemple:
Càncer de pulmó, mortalitat cardiovascular i exposició a llarg termini a contaminació atmosfèrica per partícules fines
Com es quantifiquen les associacions
• Per cada 10 g/m3 que augmenta la contaminació, la mortalitat augmenta un 6%.
• La taula reporta RR, el resultats ho interpreten com a canvi percentual.
INCERTESA, ATZAR
Incertesa, atzar
• L’atzar apareix perquè quasi sempre treballem amb mostres, no amb tota la població.– Enquesta de vot.– Estudi en un grup de pacients: si el repetim en un nou
grup de pacients el resultat no serà exactament el mateix.
– Fins i tot en condicions experimentals hi hauran petites variacions si es repeteix un altre dia → només veiem una mostra del experiments, no tots els possibles (que s’han fet i es faran)
Incertesa, atzar
• Exemple (quincunx)
http://www.mathsisfun.com/data/images/quincunx.swf
Incertesa
• L’estadística incorpora el fet que hi ha una certa variació en els resultats → incorpora la incertesa.
• Forma usual: totes les mesures estadístiques van acompanyades d’un interval de confiança.
• Indica els valors més probables on estarà el valor real.
Incertesa
• El 95% de les vegades la bola caurà entre -2 i 2.
-5 -4 -3 -2 -1 0 1 2 3 4 5
Interval de confiança al 95%: [-2, 2]
Incertesa• Exemple anterior:
• L’efecte més probable de la contaminació en la mortalitat és un augment del 6%, però podria ser entre un 2% i un 11%.
Incertesa• Exemple anterior:
• Per les altres causes de mort, l’efecte va de una reducció d’un 5% de la mortalitat a un increment d’un 6% no podem concloure res.
SIGNIFICACIÓ
Significació
• Resultats estadísticament significatius.
“…Chlamydia pneumoniae antibody titers are significantly associated with acute stroke …”
“…weekly use of hypochlorite bleach was non-significantly associated with new-onset asthma…”
“… The mode of transport was a statistically significant determinant of personal exposure to PM 2.5…”
“… this difference being clinically important although not statistically significant…”
“… Escitalopram treatment also was statistically significantly superior to citalopram…”
Significació
• p-valor: Probabilitat de que, si realment no existeix una associació, per atzar trobis una associació com la que has trobat o més forta.
• Exemple: els diabetics tenen el doble de risc de patir un atac de cor. El p-valor és de 0.02 = 2%.La probabilitat que per atzar el meu estudi trobi un
efecte del doble o més (quan en realitat no hi ha associació) és del 2%.
• Si aquesta probabilitat és molt baixa els resultats no són deguts a l’atzar.
p-valor
• Interpretació una mica complicada.• Moltes vegades s’acaba interpretant com la
probabilitat que els resultats siguin deguts a l’atzar.
• No és exacte des del punt de vista teòric, però la majoria de vegades es pot interpretar així.– Des del punt de vista comunicatiu no hi veig un gran
problema (opinió personal)
p-valor
p-valor
• Normalment p-valor<0.05 es considera estadísticament significatiu.
– Totalment arbitrari (5 dits de la mà)
• Implícitament estem acceptant que en un 5% d’estudis (1 de cada 20) ens equivoquem.
– Considerem una associació com a causal quan és deguda a l’atzar.
Replicació de resultats
(MALS) GRÀFICS
Exemples de mals gràfics
• Tallar l’eix de les Y
Exemples de mals gràfics
http://en.wikipedia.org/wiki/Misleading_graph
Exemples de mals gràfics
Font: Good Medicine Magazine
Exemples de mals gràfics
http://en.wikipedia.org/wiki/Misleading_graph
Exemples de mals gràfics
Activitat a Internet en 60 segons.
Exemples de mals gràfics
Font: New Scientist
Gràcies per la vostra atenció