marc rietveld (umc utrecht) - big data en research it
DESCRIPTION
De presentatie van Marc Rietveld (UMC Utrecht) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.TRANSCRIPT
ICT voor Research
Seminar Dutch Health Hub23 november 2011
Marc Rietveld
2
Kans Dutch Health Hub in onderzoek
» Goedkope en flexibele basisvoorziening voor storage en rekencapaciteit» Mits:
– Flexibel / hoog serviceniveau– Goedkoop– Snelle netwerkverbindingen!– Samenwerking– Veel aandacht voor beveiliging
Werken aan vertrouwen
3
Inhoud
» Trends in onderzoek» Situatie in UMC Utrecht» Situatie landelijk» Bottlenecks / vragen / issues» Mogelijke bijdrage Dutch Health Hub aan onderzoek
4
2008 2009 2010 2011 2012 2013 2014 2015 2016 2017
Trends in medisch / farmaceutisch onderzoek
Enorme groei data:- Digitalisering en
verbeteringen in meetapparatuur
- Digitalisering zorgdata- Alles opslaan, want
misschien is het bruikbaar- Koppeling & bewerking
bestaande datasets
Prof. Peter van der Spek
“De hoeveelheid
data in research
zullen 6 tot 7 keer zo groot worden als in
de zorg.”
5
100.000 ACTG per experiment 50.000.000.000
3 uur Tijd per experiment 7 uur
2 jaarTijd voor humaan
genoom2 weken
€300.000.000Kosten voor humaan
genoom€3.000
Ter ilustratiesequencing ‘old style’ vs ‘new style’
Nu:240 GB / dag
6
Trends medisch / farmaceutisch onderzoek
» Nieuwe mogelijkheden van en voor onderzoek– Patroonherkenning in grote hoeveelheden MRI’s
of CT-scans– Statistisch minder evidente causale relaties bij
grotere databases– Betere en effectievere bewaking van nieuwe
behandelingen en medicijnen door gebruik zorgdata
» Concurrentie tussen landen– Nederland scoort vooralsnog hoog wat
betreft kwaliteit van onderzoekers en infrastructuur
– Maar: Nederland is klein wat betreft bevolking
7
Situatie UMC Utrecht
» Strategiestudie ICT voor Research 2010 – 2011– Observaties
• (Digitale) zorggegevens zijn bruikbaar voor onderzoek• Van ‘zelf doen’ naar gebruik van meer centrale dienstverlening• Differentiatie van nieuwe specialismen in
onderzoeksondersteuning• Kwaliteit / monitoring onderzoek steeds belangrijker
– Plannen . • Integratie gegevensverzameling zorg en onderzoek• Research Data Platform• Ondersteuning en monitoring van onderzoeker via
Onderzoeksportaal• Basis infrastructuur: storage, high performance computing,
netwerk
8
Integratie zorg & onderzoek bij dataverzamelingGewenste situatie
Geïntegreerde zorg- en onderzoeksinformatie
Zorg- / research pad
Intake, anamnese en IC
Intake, anamnese en IC
Self reporting MyUMC
Self reporting MyUMC
9
Research Data Platform Gewenste situatie : RDP als onderdeel UMC-breed datawarehouse
OLAPBronsystemen Data storeETL
EZIS
SAP BW
Lab / medicatie
Uitvoer BI portal
Rapportxyz
Rapportxyz
Dataset
Samples
Beeld
Vragenlijsten
META DATAMETA DATA
Dataset
Dataset
• Kern ‘Research Data Platform’
• Centrale storage voorziening
• Standaarden metadatering
• Selectie tooling
• Catalogus
• Doel: data mining vs datakerkhoven
10
OnderzoeksportaalGewenste situatie
» Ondersteuning van gehele onderzoeksproces
» Toegang tot relevante expertise en ondersteuning
» Toegang tot beveiligde storage omgeving
» Delen met onderzoekers wereldwijd
» Kwatliteitsmonitoring
11
NetwerkNetwerk
ICT InfrastructuurGewenste situatie
StorageStorage
RekenkrachtRekenkracht
RekencentrumRekencentrum
Waardevolle gegevens in een goed beheerd RC
Goede/snelle verbindingen binnen UMCU
Hoge bandbreedte naar buiten
Open access & identity management
Storage als basisvoorziening
Schaalbare, flexibele storage tegen lage kosten
Gedeeltelijk eigen beheer
Metadatering om data op langere termijn te beheersen
Toegankelijk
Rekencapaciteit als basisvoorziening
Voldoende voor onderzoek op bijv. beeldmateriaal
Flexibel: (externe) voorzieningen / afspraken om pieken in rekenbehoefte op te kunnen vangen
Met energie / koeling / beveiliging goed geregeld
Hogere eisen aan security / privacy
12
LifelinesLifelines
Situatie landelijkVeel partijen, veel lijntjes, veel steigers
SURFSURF SARASARANBICNBIC
UUUU ULUL UvAUvA RUGRUG EUREUR UMUM VUVU
UMCUUMCU LUMCLUMC AMCAMC UMCGUMCG AZMAZM VUMCVUMCErasmusMCErasmusMC
KUNKUN
RadboudMCRadboudMC
LSHLSH
NFUNFU ZonMWZonMW
KNAWKNAW
CTMMCTMMBMMBMM
PSIPSIBBMRIBBMRI
IndustrieIndustrie
RIVM e.a.RIVM e.a.
Programma’s & projecten
project
project
project
projectprojectproject
TI PharmaTI Pharma
project
……
ESFRIESFRI
IMIIMI
OPSOPSPROTECTPROTECT
……FP7FP7
BioShareBioShare
BioImagingBioImaging ……
13
Gewenste situatie: samen werken aan toekomstvaste voorzieningen
» Samenhangende lokale voorzieningen waar mogelijk, centraal waar nodig
SURFSURF
SARASARA
NBICNBIC
UUUU ULUL UvAUvA RUGRUG EUREUR UMUM VUVU
UMCUUMCU LUMCLUMC AMCAMC UMCGUMCG AZMAZM VUMCVUMCErasmusMCErasmusMC
KUNKUN
RadboudMCRadboudMC
NFUNFUZonMWZonMW
KNAWKNAW
IndustrieIndustrie
RIVM e.a.RIVM e.a.
Nationale ICT
infrastructuur
» Van projectgedreven naar instituutsgedreven
DHH?
14
Issues / bottlenecks / vragen
Not invented here!
Flexibiliteit & kosten
Snelle toegangBeveiligingeigen data
Samenwerking?
15
Mogelijke bijdrage Dutch Health Hub
» Centrale voorziening voor storage en High Performance Computing» Aansluiten bij landelijke ontwikkelingen rond standaarden voor semantiek
en metadata» Afstemmen met andere soortgelijke initiatieven zoals DANS en TARGET» Randvoorwaarden:
– Flexibel / hoog serviceniveau– Goedkoop– Snelle netwerkverbindingen!– Samenwerking– Veel aandacht voor beveiliging