los datos genómicos en el ámbito de la salud

34
Escola Universitaria Gimbernat Jordi Rambla 8-Octubre-2015

Upload: escola-universitaria-dinformatica-tomas-cerda

Post on 13-Feb-2017

446 views

Category:

Technology


2 download

TRANSCRIPT

Escola Universitaria

Gimbernat

Jordi Rambla8-Octubre-2015

Los datos genómicos en el área de la salud

Jordi Rambla

EGA

Centre de Regulació Genòmica (CRG)

EUG – 8 octubre 2015

> The Central Dogma

of Biology . YouTube

fuen

te: h

ttp

://w

ww

.md

pi.c

om

/20

79

-77

37

/2/1

/37

8/h

tm

Afshinnekoo et al., Geospatial Resolution of Human and Bacterial Diversity with City-Scale Metagenomics, CELS(2015), http://dx.doi.org/10.1016/j.cels.2015.01.001

¿Datos genómicos?

• Muestras– Pacientes vs. Controles– Tumores vs. Somàtic– Padres vs. hijos (family trios)– En el futuro:

• Seguimiento vital• Microbiomas

• Tipos de datos– DNA genómico (~100GB a

30x)– Exoma (1,5% ~ 6 GB a 40x)– Transcriptoma

• RNA-Seq (~3 GB)• Expresión de genes

– “All together”• GET (Genome + Exome +

Transcriptome)

– Epigenética– Genome Wide Analysis

Studies (GWAS)– Paneles de variantes

seleccionadas

fuen

te: E

lain

e R

. Mar

dis

, Ph

.D. T

he

Gen

om

e In

stit

ute

El proceso

> QC de los datos– Calidad no uniforme

> Mapear los datos al genoma de referencia

> Detectar variantes– Base estadística

– Importancia del contexto

> Efecto (clínico) de las variantes

> Visualizar la información

Limitaciones

> Coste> de secuenciar (Standford: 17k$ por persona incl. análisis)> de analizar (Standford: 100 horas por genoma)> de almacenar (capacidad y gestión)

> De la tecnología> Falsos positivos/falsos negativos

> Ciencia en movimiento (aún estamos aprendiendo)> Relacionar genotipo (~genética) y fenotipo

(~enfermedad)> Descripción unificada de les características de los

pacientes

fuen

te: 2

3an

dM

e

Personalized/Precision Medicine

> Permite identificar riesgos/predisposición a enfermedades

> Permite identificar incidencias concretas en las vías metabólicas y actuar en la causa “real”> Evitando efectos secundarios “inútiles”

> ¿Ahorro?> ¿Se trata de una inversión a medio plazo?

> “El médico será menos artista y más científico”, “las TIS serán más necesarias para agregar los datos”

Aspectos éticos

> Algunos derivan de la potencia del test> Incidental findings

> Compartimos genética con nuestros familiares

> Relacionados con la confidencialidad> Identificación de personas

> El paciente/usuario como propietario de los datos

> Derecho a “retracción”

Eric GreenDtor. NHGRIFebrero 2014

Papá, ¿falta mucho para llegar?

¿Y el Business Intelligence?

• (un momento, todo llega)

Athey and Omenn, 2009

Dimensionalidad de los datos

Populations

Un ejemplo: TranSMART project

En el postgrado: Modelos de DW

Otros datos

Informes

Cuadros de mando

Consultas Adhoc

Hojas de cálculo

Deleg

ERP

Cli Mktg Fras.

Datawarehouse

Elementos de una solución de BI (5)

DDS Área deStaging

Data Quality MDB

Control + Auditoría

ETL + DQ

ETL Staging

Correcciones

BBDD Control

Aplicaciones BI

Informes

Cuadros de mando

Consultas Adhoc

Tablas dinámicas

Hojas de cálculo

Sistemas origen

242015 Postgrado en BI

- 25 -

*Note: Representative diagram – not all integrations are shown

Big picture type solution for ‘AMC’ genomics initiatives

RI Analytics & Care DeliverySource Data

Clinical Trials,

Registries,

Internal/External

Results

Biobanks

LIMS

‘Omics

Platforms

(CLC Bio)

Clinical EMRs

& Claims

Labs

Partner

Clinical data

Master Data Management

MPI/ProviderScientific

Reference

Terminology

Reference

Common

Services MPI HPCRef Data Mgmt Hub Security Collaboration Portal Storage

Data Trust

Research Trust

Data Warehouse /

Research Stores

Clinical

Research

Omics

ETL

Data

Curation

Data De-

Identification

Data Workflow/

Enhancement

Closed Loop

Translational Research

Applications

Statistical Analysis

R SPSS SAS

Res

ea

rch

Po

rtal

Research Open Source

i2b2tranSMART/

Sample Explorer

Extended SystemsStudy

Recruitment

Manager

Omics/Cohort

Explorer

Honest Broker

Data Pipeline

Research

Information

Exchange

File Store

e.g. genomics (BAM, VCF, CEL)

Publications, PDF, Pathology

Research

Data Marts

European Genome-phenome Archive

> Archivo seguro, a largo plazo, para datos humanos que requieren acceso controlado

> Datos actuales> ~800.000 ficheros

> ~2 Petabytes (… y creciendo)

> 1.144 estudios (ICGC, UK10K, RD, WTCCC…)

> 463 cáncer, 44 neurología, 96 cardiovasculares…

> 220 WGS, 230 exomas, 77 epigenética, 186 GWAS…

> 153 cohortes, 108 famílias, 35 mellizos…

Sensor data is Big Data

Informatica.com

BigData enters the picture

http://bigdatablog.emc.com

Un ejemplo: EMC

En resumen…

> Los “datos genómicos” son muy diversos

> Hay condiciones y limitaciones claras

> El mercado empuja fuerte

> “Lo peor está por venir”

> BI es imprescindible por la amplia dimensionalidad de los datos

> No sólo el BI clásico, si no también el “moderno” que se apoya en BigData

¡Gracias!