Uso de modelos de escala genómica para entender
la fisiología de microorganismos
Modelos
metabólicos de
escala genómica
datos de secuenciación
genómica
Información bioquímica
Muchas veces no obtenemos el resultado esperado al cambiar alguna vía
determinada, esto es por que las rutas están altamente reguladas y un mayor
conocimiento de la fisiología microbiana es necesaria.
Los modelos pueden ser usados para analizar y simular el metabolismo de un
determinado microorganismo en respuesta a diferentes estimulos
Fisiología microbiana
Transcripción genética
Traducción proteica
Cinética enzimática
Composición interna (carga energética
intracelular, potencial redox, pH)
Ambiente extracelular ( Oxígeno disuelto,
fuentes de estrés físico o químico).
Muchas veces no obtenemos el resultado esperado al cambiar alguna vía
determinada, esto es por que las rutas están altamente reguladas y un mayor
conocimiento de la fisiología microbiana es necesaria.
Recontrucción de modelos de escala
genómica
• 5 pasos: (Thiele, I. and Palsson, B.O. (2010) A protocol for generating a high-quality
• genome-scale metabolic reconstruction. Nat. Protoc. 5, 93–121)
• (1) Creación de un bosquejo o draft del
modelomodelo
• (2) Reconstrucción del modelo detallado
• (3) Conversión a un formato matemático
• (4) Identificación de gaps
• (5) Simulación y visualización
Información de bases
de datos del genoma
Este primer modelo es luego
corregido según datos de
diferentes fuentes
Se realiza el modelado
matemático y se evalúa su matemático y se evalúa su
funcionamiento con datos
fenotípicos
El modelo se refina con high
throughput-data y se mejora
Utilización del modelo para
diferentes fines
1) Bases de datos específicas para determinados organismos: EcoCyc para E. coli y SGD o
Comprehensive Yeast Genome Database (CYGD) para Saccharomyces u otras levaduras.
Para otros microorganismos: Integrated Microbial Genomes (IMG), Comprehensive
Microbial Resource (CMR), entre otros.
Para obtener las reacciones bioquímicas que catalizan los enzimas codificadas por los
genes encontrados, los números EC son incorporados a bases de datos como KEGG ,
Brenda, Enzyme, Biocyc , Transport DB, o bien a modelos metabólicos existentes de
microorganismos cercanos filogenéticamente (ej modelos en BIGG database (BIGG).
A nuestra base de datos debemos incorporar la siguiente información:
Nombre del gen y detalles de las reacciones individuales como:
(1) metabolitos y cofactores
(2) Fórmula química o InChI string para cada metabolito
Sólo genes que codifican enzimas y transportadores de membrana son utilizados.
(2) Fórmula química o InChI string para cada metabolito
(3) Identificadores para cada metabolito . Se utilizan base de datos de compuestos,
como CHEBI (http//www.ebi.ac.uk/chebi), PubChem
(http://ncbi.nlm.nih.gov/sites/entrez), o KEGG http://www.genome.jp);
(4) Reacción estequiométrica y direccción
(5) Ubicación de la reacción
(6) Identificados de la reacción. Se usan bases de datos como KEGG
(7) Identificación de los subsistemas metabólicos donde participan.
En esta etapa sólo se incluyen reacciones bioquímcas candidatas. No deben ser
consideradas: proteínas que catalizan reacciones bioquímicas como metilación de
ADN, modificación de rRNA, o funcionan como kinasas en traducción de señales (que
también tienen número EC asignados).
Hay varios casos especiales que deben ser considerados:
(1) Actividades enzimáticas reciéntemente identificadas, que aun no
tienen un número EC asignado.
(2) Anotaciones que sólo proveen una clasificación más general en
categórias GO, pero no tienen un número EC asignado
(3) Algunas enzimas tienen un espectro de especificidades y aceptan
múltiples sustratos, por ejemplo: alcohol deshidrogenasa (EC1.1.1.1),
que cataliza la oxidación de varios alcohles primarios
(4) Isoenzimas que son codificadas por diferentes genes, pero que(4) Isoenzimas que son codificadas por diferentes genes, pero que
catalizan la misma reacción
(5) Hay varios genes asociados con una o más reacciones catalizadas
por un complejo enzimático.
Para encontrar información al respecto hay varios softwares (ej
PATHOLOGIC) o UniProtKB y datos bibliográficos
Link donde encuentran información sobre diferentes bases de datos que pueden
usarse: The pathway tools software
Un paso crucial en la reconstrucción de modelos a escala genómica, es la adición de
reacciones que no son inferidas de la anotación genómica . La incorporación de estas
recciones va a disminuir el número de dead-end metabolitos y mejorar la conectividad del
modelo
La reacción estequiométrica de síntesis de biomasa es determinada por las
cantidades relativas de macromoléculas y building blocks en la composición de
biomasa del microorganimo en estudio, generalmente esta información la obtenemos
de literatura. Si no contamos con esta información, debe ser obtenida
experimentalmente de células creciendo en fase logarítmica.
También debe incluirse requerimientos energéticos (ATP) y mantenimiento. Que
pueden obtenerse de cultivos continuos
La reconstrucción del modelo debe tener información conserniente a:
(1) Sustratos disponibles(1) Sustratos disponibles
(2) Auxotropías
(3) Composición del medio de cultivo
(4) Velocidades específicas.
Conversión en un modelo matemático
Se imponen cierta restricciones sobre el modelo de manera tal que aproxime lo mejor posible al microrganismo vivo
En modelos de escala genomica generalmente se utilizan:
En modelos de escala genomica generalmente se utilizan:
• Balance de flujos (AV=0)
• Balance de energía (ΔE=0)
• Capacidad enzimática o de transporte (limita velocidades de flujos)
• Termodinámica (Virrev>0)
Se debe chequear la consistencia del modelo. Verificar que no haya gaps
metabólicos. Para ello se realiza una intensa búsqueda bibliográfica, se recurre a
bases de datos, etc.
Es importante remarcar que adicionar nuevas reacciones metabólicas puede generar
nuevos gaps, por lo que si esto sucede, verificar que todos los metabolitos estén
conectados en el diagrama metabólico.
Verificación del modelo
Verificar la habilidad del modelo de producir biomasa en diferentes medios de cultivo y
bajo todas las condiciones de crecimiento conocidas. Validación de la capacidad del
modelo
Verificar la velocidad de crecimiento en diferente medios
Testear que el modelo puede producir todos los metabolitos secretados para un sustrato
dado y que las velocidades de producción sean acordes
Verificación del modelo
Testear que el modelo puede producir todos los metabolitos secretados para un sustrato
dado y que las velocidades de producción sean acordes
Utilizar el modelo para predecir el crecimiento de diferentes fenotipos.
Comparación con datos experimentales
In vivo and in silico determination of essential
genes of Campylobacter jejuni
• A metabolic model of C. jejuni was constructed using the annotation of
the NCTC 11168 genome sequence, a published model of the related
bacterium Helicobacter pylori, and extensive literature mining.
• In silico Flux Balance Analysis (FBA) was used to determine key metabolic
routes that are essential for generating energy and biomass, thus creating routes that are essential for generating energy and biomass, thus creating
a list of genes potentially essential for growth under laboratory conditions.
• Candidate essential genes have been determined using a whole genome
transposon mutagenesis method. FBA and transposon mutagenesis (both
this study and a published study) predict a similar number of essential
genes (around 200) new antibiotic targets
The resulting network is made of 536 reactions in total accounting for 388 genes and
467 metabolites: 1471-2164-12-535-s1 (1).xls
Exploration of the predicted metabolism of C. jejuni
The production of biomass from different carbon sources was simulated:
12864_2011_3727_MOESM2_ESM (2).xlsx
In silico prediction and experimental identification of essential genes in C. Jejuni
The metabolic model in combination with FBA was used to predict the metabolic genes
that are essential for the production of biomass in rich medium 1471-2164-12-535-s3.xls
Random in vitro transposition verified 60% of the results 1471-2164-12-535-s3.xls