dai registri a big data: opportunità e limiti · dai registri a "big data": opportunità...
TRANSCRIPT
Dai Registri a "Big Data":
opportunità e limiti
Convention della Cardiologia Lombarda
Como, 30-31 marzo 2017
Maria Frigerio
Direttore Cardiologia 2, Insufficienza Cardiaca e Trapianto
Direttore DeGasperis CardioCenter,
ASST Grande Ospedale Metropolitano Niguarda, Milano
1987 1997 2007
La stagione dei grandi trial:
Inibizione RAAS, da CONSENSUS a PARADIGM-HF
PZFollow-up
medianoEnd-point Esito Significatività
CONSENSUS,
1987
N= 253,
NYHA IV
70 a, F 30%
6 mesi Morte a 6 mesiPlacebo 44%,
Enalapril 26%
RR - 40%,
p=0.002
PARADIGM-
HF, 2015
N=8442,
NYHA II-IV
68 a., F 22%
LVEF <40%
27 mesi
Mortalità CV +
ricovero HF;
Mortalità totale
Enalapril 26.5%
LCZ696* 22%
Enalapril 20%
LCZ696* 17%
HR 0.80,
p<0.001
HR 0.84,
p<0.001
PARADIGM-HF
2014
SOLVD, 1991 RALES, 1999 CHARM, 2003 EMPHASIS, 2011
CONSENSUS
1987
ELITE II, 2000, Val-HeFT, 2001
ATMOSPHERE...
*: valsartan/sacubitril
Dai trial a "Big Data": fattori di contesto
Dal presente al futuro
Costo gestione dati1 megabyte: Da >100000 dollari nel 1950
a poco più di 0,007 centesimi attuali
Costo conduzione trial Aumento
- Pazienti da arruolareDa 253 CONSENSUS, 1987,
a 8442 PARADIGM-HF, 2014
- Tempo di osservazione
(cronici)
Da 6 mesi, CONSENSUS, 1987,
a 27 mesi PARADIGM-HF, 2014
Età pazienti Trial: Dipendente da criteri di inclusione
Mondo reale: aumento
Prevalenza comorbilitàTrial: Dipendente da criteri di inclusione
Mondo reale: aumento
Dai trial a "Big Data"
I trial Big Data
Generazione ipotesi Ideazione Algoritmi
Verifica ipotesi Sequenziale Simultanea
Contesto Sperimentale Reale
Dati Qualità Quantità
MetodoDeduttivo (validare la teoria
osservando la realtà)
Induttivo (elaborare la teoria
interpretando la realtà)
InputCondizione definita,
soggetti esclusi a priori
Sottogruppi definiti (ev. soggetti
esclusi) a posteriori
OutputCorrelazioni causa-effetto
Interpretazione fisiopatologica
Associazioni multiparametriche
Generazione di conoscenze inattese
ApplicazioneStudio di malattia: terapia, tecnica
diagnostica...
Studio di soggetti: genetica, ambiente,
risposta alle cure... E non solo
Caratteristiche di "Big Data" - 1
N° casi
x
N° variabili/
caso
= Prodotto-
soglia
n pLog(n x p) >7
(> 10.000.000)
Le 3 – (5) V Note
1 Volume v.
2 Varietà
Fonti multiple,
non strutturate,
non finalizzate
3 VelocitàIn tempo reale – o
quasi
(4) Veridicità
Difficile
validazione,
accuratezza
limitata
(5) Valorizzazione Limiti (2,3,4)
Baro E, Biomed Research International 2015, ID 639021
Schneeweiss S, J Clin Epidemiol 2005;58: 323-7
… e i Registri?
I grandi trial Registri Big Data
Generazione
ipotesiIdeazione Osservazione Algoritmi
Verifica
ipotesiSequenziale Preordinata Simultanea
Contesto Sperimentale Reale / selezionato Reale /(universale?)
Dati Qualità ----- Quantità
MetodoDeduttivo (validare la teoria
osservando la realtà)<---------->
Induttivo (elaborare la teoria
interpretando la realtà)
InputCondizione definita,
soggetti esclusi a prioriCondizione definita
Sottogruppi definiti (ev.
soggetti esclusi) a posteriori
Output
Correlazioni causa-effetto
Interpretazione
fisiopatologica
Associazioni di possibile
natura causale
Interpretazione
fisiopatologica
Associazioni
multiparametriche
Generazione di conoscenze
inattese
ApplicazioneStudio di malattia: terapia,
tecnica diagnostica...
Studio di malattia e di
soggetti: epidemiologia,
prognosi, prassi...
Studio di soggetti: genetica,
ambiente, risposta alle cure...
E non solo
Big Data, un registro più grande?
Caratteristiche di "Big Data" - 2
Ambito N° casi N° variabili/caso obiettivi
"Omics" Limitato Elevato
- Predizione di rischio
- Predizione di effetto di terapie
- Interazione con altri fattori (medici –
sociali – ambientali....)
- Identificazione di substrato/meccanismi di
(manifestazione di) malattia…
Specialità
mediche
Moderatamente
elevato
Moderatamente
elevato
- Profilazione di sottogruppi, outliers,
e pz "medio"
- Valutazione prognostica
- Sorveglianza post-marketing
- Qualità dei processi di cura
- "comparative effectiveness research"?
- HTA?
Salute
pubblica Elevato Limitato
- Trend temporali di malattia
- Prassi gestionali e prescrittive
- Stima dei fabbisogni sanitari
Baro E, Biomed Research International 2015, ID 639021
Schneeweiss S, J Clin Epidemiol 2005;58: 323-7
Incidenza primo ricovero, 2005-2012, Lombardia
Distribuzione età
all'evento incidente (G1)
(/1000 res/anno)
Mondo dei trial e mondo reale
p < 0.0001
p < 0.0001
Insufficienza cardiaca avanzata
Insufficienza cardiaca lieve/moderata
Farmaci e sopravvivenza, trials e mondo reale
Mc Murray JJ, Eur J Heart Fail 2014;929-936
0
10000
20000
30000
40000
50000
60000
70000
80000
ACE-I/ARB NO ACE-I/ARB
Prescrizione ACE-I/ARB e mortalità
VIVI MORTI
0%
20%
40%
60%
80%
100%
ACE-I/ARB NO ACE-I/ARB
% VIVI % MORTI
0
10000
20000
30000
40000
50000
60000
70000
BB NO BB
Prescrizione BB e mortalità
VIVI MORTI
0%
20%
40%
60%
80%
100%
BB NO BB
% VIVI % MORTI
Regione Lombardia HFDATA, 2005-2012, all-cause mortality
Maggioni A et al, Heart 2003; 299-305
Dai trials al mondo reale: lo studio Bring-Up –
Moderate Heart Failure
Insufficienza cardiaca
lieve/moderata
Dai trials e mondo reale: lo studio Bring-Up 2 –
Severe Heart Failure
Opasich C et al, Eur J Heart Fail 2006; 8: 649-57
All N 1-year mortality
BB untreated 247 25%
BB already treated 271 13%
BB starting treatment 187 14%
Insufficienza cardiaca avanzata
• Maggiore variabilità genetica in afroamericani (AA) che in
Euroasiatici (EA)
• Le stesse variazioni sono riscontrabili, in quota diversa, nei
diversi gruppi etnici
• Possibile associazione tra polimorfismi e suscettibilità a
malattia e risposta alle terapie
• Polimorfismo recettori beta-adrenergici
• Associati a maggior/minor affinità X NE...
• ... a maggior/minor risposta a beta-bloccanti...
• Differenze più evidenti a basse dosi
Etnia e risposta alla terapia
BEST trial, A: ALL B: European C:African-American
Questioni di dimensioni e di metodo
Meta-analisi
- Somma di trials = Big Data?
- Valore aggiunto all'analisi dei sottogruppi?
Registri e dati amministrativi
- Necessari per validare sul campo i risultati dei trials?
- Utili per costruire le evidenze dove i trials sono difficili?
Metodologia statistica
- Comportamenti non univoci delle variabili quantitative
- Dall'analisi multivariata alla profilazione multiparametrica
L'ICD – Metanalisi
su dati individuali(~13.000 pazienti, F <25%)
Heart 2015;101:1800–1806.
L'ICD – Metanalisi
International Journal of Cardiology 173 (2014) 197–203
JAMA, January 2, 2013—Vol 309, No. 1
L'ICD nei trials e nei registri - US
L'ICD nei Registri - US
J Am Heart Assoc. 2015;4:e002061 doi: 10.1161/ JAHA.115.002061
"Big Data": basta essere grandi per avere senso?
▪ Ipotesi: inquinamento e ricoveri x scompenso
- Lombardia Informatica: dati sui ricoveri
- ARPA: dati su inquinamento
➢ esiste una correlazione?
▪ I pz ricoverati
- area di residenza o area di lavoro... ?
▪ L'inquinamento
- picchi o media?
- ore, giorni...
➢ lasciamo "pensare" il computer... ma come?
Dati amministrativi e EMR = "Big Data"?
Dal presente al futuro
Dati disponibili/soggetto Limitato
Uniformità compilazione Id
Variabilità prassi medica Teoricamente eliminabile?
Variabilità aderenza paziente Non eliminabile
Proprietà dati e privacy Rispetto degli individui o questione di potere?
Velocità analisi Non sempre elevata
Titolare dati SANITARI: il soggetto
- Accessi tracciati e registrati in modo permanente
- Consentiti solo se finalizzati alla cura del soggetto
- Il soggetto può richiedere la lista degli accessi ai propri dati,
e chiederne spiegazione agli interessati
Titolare dati AMMINISTRATIVI: la regione ...
- ...e l'ufficio flussi dell'Ospedale
- Qual é il confine tra dati amministrativi e dati sanitari?
Fascicolo Sanitario Elettronico, usi consentiti
La nuova SDO: la via italiana a Big Data?
SDO 2015 SDO 2016
Anagrafica Automatica Id
Data in/out Automatica Id
Modalità in Automatica, modificabile Id
Modalità out Default, modificabile Id
Diagnosi
Manuale (Comorbilità solo se
influiscono su impegno risorse/
solo se modificano DRG)
Manuale (Comorbilità: indicare se
preesistenti o di nuova
comparsa/complicanze?)
Interventi/
procedureData, codice: Manuale
Data, codice
Primo operatore
In caso di IMA - PA all'ingresso
In SEMEOTICONS, we propose the definition of the digital semeiotics of
the face, i.e. the computerized evaluation of facial signs, focused on those signs that relate to some widely-recognized risk factors of CVDs.
These signs above will assessed by a number of computationaldescriptors that will be extracted from different observation
modalities (morphometric, biometric, colorimetric, gestural and emotional analyses of the face, spectroscopic analysis of skin and iris, sub-cutaneous substances and the function of sub-cutaneoustissues, compositional analysis of breath and exhaled gas).
www.semeoticons.eu
Social networking & research
• Spontaneous participation (primary prevention)
• Call for recruitment
• Dissemination
• Identify research questions
• (professional) networking
• Fund raising
• Crowdfunding
MyHeartCounts, un esempio di ricerca diffusa • Monitoraggio attività fisica
• Questionario stato di salute, stile di vita
• Raccomandazioni generali e feedback
• Ricerca prospettica
Da "Big Data" all'Intelligenza
Artificiale: Le 3 leggi di Asimov
1. A robot may not injure a human being
or, through inaction, allow a human
being to come to harm.
2. A robot must obey any orders given to
it by human beings, except where such
orders would conflict with the First
Law.
3. A robot must protect its own existence
as long as such protection does not
conflict with the First or Second Law. »
Da "Big Data" all'Intelligenza Artificiale:
Le leggi di Clarke
«Quando un illustre ma anziano scienziato sostiene che
qualcosa è possibile, ha quasi certamente ragione.
Quando sostiene che qualcosa è impossibile, ha quasi
certamente torto.»
➢ Le leggi di Asimov sono state uno strumento letterario di successo. …
la somma delle storie di Asimov confutano la tesi con cui iniziò: Non è
possibile limitare con certezza il comportamento dei robot..