usode modelosde escalagenómicaparaentender la fisiologíade

19
Uso de modelos de escala genómica para entender la fisiología de microorganismos Modelos metabólicos de escala genómica datos de secuenciación genómica Información bioquímica Muchas veces no obtenemos el resultado esperado al cambiar alguna vía determinada, esto es por que las rutas están altamente reguladas y un mayor conocimiento de la fisiología microbiana es necesaria. Los modelos pueden ser usados para analizar y simular el metabolismo de un determinado microorganismo en respuesta a diferentes estimulos

Upload: others

Post on 03-Apr-2022

2 views

Category:

Documents


0 download

TRANSCRIPT

Uso de modelos de escala genómica para entender

la fisiología de microorganismos

Modelos

metabólicos de

escala genómica

datos de secuenciación

genómica

Información bioquímica

Muchas veces no obtenemos el resultado esperado al cambiar alguna vía

determinada, esto es por que las rutas están altamente reguladas y un mayor

conocimiento de la fisiología microbiana es necesaria.

Los modelos pueden ser usados para analizar y simular el metabolismo de un

determinado microorganismo en respuesta a diferentes estimulos

Fisiología microbiana

Transcripción genética

Traducción proteica

Cinética enzimática

Composición interna (carga energética

intracelular, potencial redox, pH)

Ambiente extracelular ( Oxígeno disuelto,

fuentes de estrés físico o químico).

Muchas veces no obtenemos el resultado esperado al cambiar alguna vía

determinada, esto es por que las rutas están altamente reguladas y un mayor

conocimiento de la fisiología microbiana es necesaria.

Información

Recontrucción de modelos de escala

genómica

• 5 pasos: (Thiele, I. and Palsson, B.O. (2010) A protocol for generating a high-quality

• genome-scale metabolic reconstruction. Nat. Protoc. 5, 93–121)

• (1) Creación de un bosquejo o draft del

modelomodelo

• (2) Reconstrucción del modelo detallado

• (3) Conversión a un formato matemático

• (4) Identificación de gaps

• (5) Simulación y visualización

Información de bases

de datos del genoma

Este primer modelo es luego

corregido según datos de

diferentes fuentes

Se realiza el modelado

matemático y se evalúa su matemático y se evalúa su

funcionamiento con datos

fenotípicos

El modelo se refina con high

throughput-data y se mejora

Utilización del modelo para

diferentes fines

1) Bases de datos específicas para determinados organismos: EcoCyc para E. coli y SGD o

Comprehensive Yeast Genome Database (CYGD) para Saccharomyces u otras levaduras.

Para otros microorganismos: Integrated Microbial Genomes (IMG), Comprehensive

Microbial Resource (CMR), entre otros.

Para obtener las reacciones bioquímicas que catalizan los enzimas codificadas por los

genes encontrados, los números EC son incorporados a bases de datos como KEGG ,

Brenda, Enzyme, Biocyc , Transport DB, o bien a modelos metabólicos existentes de

microorganismos cercanos filogenéticamente (ej modelos en BIGG database (BIGG).

A nuestra base de datos debemos incorporar la siguiente información:

Nombre del gen y detalles de las reacciones individuales como:

(1) metabolitos y cofactores

(2) Fórmula química o InChI string para cada metabolito

Sólo genes que codifican enzimas y transportadores de membrana son utilizados.

(2) Fórmula química o InChI string para cada metabolito

(3) Identificadores para cada metabolito . Se utilizan base de datos de compuestos,

como CHEBI (http//www.ebi.ac.uk/chebi), PubChem

(http://ncbi.nlm.nih.gov/sites/entrez), o KEGG http://www.genome.jp);

(4) Reacción estequiométrica y direccción

(5) Ubicación de la reacción

(6) Identificados de la reacción. Se usan bases de datos como KEGG

(7) Identificación de los subsistemas metabólicos donde participan.

En esta etapa sólo se incluyen reacciones bioquímcas candidatas. No deben ser

consideradas: proteínas que catalizan reacciones bioquímicas como metilación de

ADN, modificación de rRNA, o funcionan como kinasas en traducción de señales (que

también tienen número EC asignados).

Hay varios casos especiales que deben ser considerados:

(1) Actividades enzimáticas reciéntemente identificadas, que aun no

tienen un número EC asignado.

(2) Anotaciones que sólo proveen una clasificación más general en

categórias GO, pero no tienen un número EC asignado

(3) Algunas enzimas tienen un espectro de especificidades y aceptan

múltiples sustratos, por ejemplo: alcohol deshidrogenasa (EC1.1.1.1),

que cataliza la oxidación de varios alcohles primarios

(4) Isoenzimas que son codificadas por diferentes genes, pero que(4) Isoenzimas que son codificadas por diferentes genes, pero que

catalizan la misma reacción

(5) Hay varios genes asociados con una o más reacciones catalizadas

por un complejo enzimático.

Para encontrar información al respecto hay varios softwares (ej

PATHOLOGIC) o UniProtKB y datos bibliográficos

Link donde encuentran información sobre diferentes bases de datos que pueden

usarse: The pathway tools software

Un paso crucial en la reconstrucción de modelos a escala genómica, es la adición de

reacciones que no son inferidas de la anotación genómica . La incorporación de estas

recciones va a disminuir el número de dead-end metabolitos y mejorar la conectividad del

modelo

La reacción estequiométrica de síntesis de biomasa es determinada por las

cantidades relativas de macromoléculas y building blocks en la composición de

biomasa del microorganimo en estudio, generalmente esta información la obtenemos

de literatura. Si no contamos con esta información, debe ser obtenida

experimentalmente de células creciendo en fase logarítmica.

También debe incluirse requerimientos energéticos (ATP) y mantenimiento. Que

pueden obtenerse de cultivos continuos

La reconstrucción del modelo debe tener información conserniente a:

(1) Sustratos disponibles(1) Sustratos disponibles

(2) Auxotropías

(3) Composición del medio de cultivo

(4) Velocidades específicas.

Conversión en un modelo matemático

Se imponen cierta restricciones sobre el modelo de manera tal que aproxime lo mejor posible al microrganismo vivo

En modelos de escala genomica generalmente se utilizan:

En modelos de escala genomica generalmente se utilizan:

• Balance de flujos (AV=0)

• Balance de energía (ΔE=0)

• Capacidad enzimática o de transporte (limita velocidades de flujos)

• Termodinámica (Virrev>0)

Se debe chequear la consistencia del modelo. Verificar que no haya gaps

metabólicos. Para ello se realiza una intensa búsqueda bibliográfica, se recurre a

bases de datos, etc.

Es importante remarcar que adicionar nuevas reacciones metabólicas puede generar

nuevos gaps, por lo que si esto sucede, verificar que todos los metabolitos estén

conectados en el diagrama metabólico.

Verificación del modelo

Verificar la habilidad del modelo de producir biomasa en diferentes medios de cultivo y

bajo todas las condiciones de crecimiento conocidas. Validación de la capacidad del

modelo

Verificar la velocidad de crecimiento en diferente medios

Testear que el modelo puede producir todos los metabolitos secretados para un sustrato

dado y que las velocidades de producción sean acordes

Verificación del modelo

Testear que el modelo puede producir todos los metabolitos secretados para un sustrato

dado y que las velocidades de producción sean acordes

Utilizar el modelo para predecir el crecimiento de diferentes fenotipos.

Comparación con datos experimentales

FBA

In vivo and in silico determination of essential

genes of Campylobacter jejuni

• A metabolic model of C. jejuni was constructed using the annotation of

the NCTC 11168 genome sequence, a published model of the related

bacterium Helicobacter pylori, and extensive literature mining.

• In silico Flux Balance Analysis (FBA) was used to determine key metabolic

routes that are essential for generating energy and biomass, thus creating routes that are essential for generating energy and biomass, thus creating

a list of genes potentially essential for growth under laboratory conditions.

• Candidate essential genes have been determined using a whole genome

transposon mutagenesis method. FBA and transposon mutagenesis (both

this study and a published study) predict a similar number of essential

genes (around 200) new antibiotic targets

The resulting network is made of 536 reactions in total accounting for 388 genes and

467 metabolites: 1471-2164-12-535-s1 (1).xls

Exploration of the predicted metabolism of C. jejuni

The production of biomass from different carbon sources was simulated:

12864_2011_3727_MOESM2_ESM (2).xlsx

In silico prediction and experimental identification of essential genes in C. Jejuni

The metabolic model in combination with FBA was used to predict the metabolic genes

that are essential for the production of biomass in rich medium 1471-2164-12-535-s3.xls

Random in vitro transposition verified 60% of the results 1471-2164-12-535-s3.xls