los datos genómicos en el ámbito de la salud
Post on 13-Feb-2017
448 Views
Preview:
TRANSCRIPT
Los datos genómicos en el área de la salud
Jordi Rambla
EGA
Centre de Regulació Genòmica (CRG)
EUG – 8 octubre 2015
Afshinnekoo et al., Geospatial Resolution of Human and Bacterial Diversity with City-Scale Metagenomics, CELS(2015), http://dx.doi.org/10.1016/j.cels.2015.01.001
¿Datos genómicos?
• Muestras– Pacientes vs. Controles– Tumores vs. Somàtic– Padres vs. hijos (family trios)– En el futuro:
• Seguimiento vital• Microbiomas
• Tipos de datos– DNA genómico (~100GB a
30x)– Exoma (1,5% ~ 6 GB a 40x)– Transcriptoma
• RNA-Seq (~3 GB)• Expresión de genes
– “All together”• GET (Genome + Exome +
Transcriptome)
– Epigenética– Genome Wide Analysis
Studies (GWAS)– Paneles de variantes
seleccionadas
El proceso
> QC de los datos– Calidad no uniforme
> Mapear los datos al genoma de referencia
> Detectar variantes– Base estadística
– Importancia del contexto
> Efecto (clínico) de las variantes
> Visualizar la información
Limitaciones
> Coste> de secuenciar (Standford: 17k$ por persona incl. análisis)> de analizar (Standford: 100 horas por genoma)> de almacenar (capacidad y gestión)
> De la tecnología> Falsos positivos/falsos negativos
> Ciencia en movimiento (aún estamos aprendiendo)> Relacionar genotipo (~genética) y fenotipo
(~enfermedad)> Descripción unificada de les características de los
pacientes
Personalized/Precision Medicine
> Permite identificar riesgos/predisposición a enfermedades
> Permite identificar incidencias concretas en las vías metabólicas y actuar en la causa “real”> Evitando efectos secundarios “inútiles”
> ¿Ahorro?> ¿Se trata de una inversión a medio plazo?
> “El médico será menos artista y más científico”, “las TIS serán más necesarias para agregar los datos”
Aspectos éticos
> Algunos derivan de la potencia del test> Incidental findings
> Compartimos genética con nuestros familiares
> Relacionados con la confidencialidad> Identificación de personas
> El paciente/usuario como propietario de los datos
> Derecho a “retracción”
En el postgrado: Modelos de DW
Otros datos
Informes
Cuadros de mando
Consultas Adhoc
Hojas de cálculo
Deleg
ERP
Cli Mktg Fras.
Datawarehouse
Elementos de una solución de BI (5)
DDS Área deStaging
Data Quality MDB
Control + Auditoría
ETL + DQ
ETL Staging
Correcciones
BBDD Control
Aplicaciones BI
Informes
Cuadros de mando
Consultas Adhoc
Tablas dinámicas
Hojas de cálculo
Sistemas origen
242015 Postgrado en BI
- 25 -
*Note: Representative diagram – not all integrations are shown
Big picture type solution for ‘AMC’ genomics initiatives
RI Analytics & Care DeliverySource Data
Clinical Trials,
Registries,
Internal/External
Results
Biobanks
LIMS
‘Omics
Platforms
(CLC Bio)
Clinical EMRs
& Claims
Labs
Partner
Clinical data
Master Data Management
MPI/ProviderScientific
Reference
Terminology
Reference
Common
Services MPI HPCRef Data Mgmt Hub Security Collaboration Portal Storage
Data Trust
Research Trust
Data Warehouse /
Research Stores
Clinical
Research
Omics
ETL
Data
Curation
Data De-
Identification
Data Workflow/
Enhancement
Closed Loop
Translational Research
Applications
Statistical Analysis
R SPSS SAS
Res
ea
rch
Po
rtal
Research Open Source
i2b2tranSMART/
Sample Explorer
Extended SystemsStudy
Recruitment
Manager
Omics/Cohort
Explorer
Honest Broker
Data Pipeline
Research
Information
Exchange
File Store
e.g. genomics (BAM, VCF, CEL)
Publications, PDF, Pathology
Research
Data Marts
European Genome-phenome Archive
> Archivo seguro, a largo plazo, para datos humanos que requieren acceso controlado
> Datos actuales> ~800.000 ficheros
> ~2 Petabytes (… y creciendo)
> 1.144 estudios (ICGC, UK10K, RD, WTCCC…)
> 463 cáncer, 44 neurología, 96 cardiovasculares…
> 220 WGS, 230 exomas, 77 epigenética, 186 GWAS…
> 153 cohortes, 108 famílias, 35 mellizos…
Informatica.com
BigData enters the picture
fuent: Haddop Summit 2013
http://bigdatablog.emc.com
Un ejemplo: EMC
En resumen…
> Los “datos genómicos” son muy diversos
> Hay condiciones y limitaciones claras
> El mercado empuja fuerte
> “Lo peor está por venir”
> BI es imprescindible por la amplia dimensionalidad de los datos
> No sólo el BI clásico, si no también el “moderno” que se apoya en BigData
top related