presentación de powerpoint - fbmc marcadores... · marcadores morfológicos fenotipos que resultan...
TRANSCRIPT
Curso 2017
Marcadores Moleculares
Esteban Hopp
Departamento de Fisiología, Biología Molecular y Celular Facultad de Ciencias Exactas y Naturales
Universidad de Buenos Aires
Marcadores Morfológicos
Fenotipos que resultan de mutaciones en el ADN
Tomado de “The Cartoon Guide to Genetics”, Larry Gonick, Marck Wheelis
¿Qué son los
marcadores
genéticos?
Gregor Mendel
(Moravian Museum, Brno)
• El concepto de marcador surge con
los trabajos de Mendel:
Utilizó los colores de las flores (y otros caracteres
morfológicos) como marcadores que le permitieron
estudiar los patrones de la herencia
Jardín del monasterio donde Mendel realizaba
sus experimentos con las arvejas
Tomado de: Griffiths et al., An Introduction to Genetic Analysis, 2000.
• Permiten establecer diferencias (polimorfismos) entre
dos individuos diferentes (genotipos) pertenecientes a la
misma especie (o a especies emparentadas).
• Su herencia suele responder a las leyes de Mendel.
• Los primeros marcadores utilizados fueron los de tipo
morfológico (fenotípicos), por ejemplo, color de la flor.
• Permiten la confección de mapas genéticos o de
ligamiento.
• Son puntos de referencia ubicados en los cromosomas.
¿Qué son los
marcadores
genéticos?
¿Puede un marcador genético ser fenotípico y
genotípico?
Fenotípicos: los polimorfismos de los genes se detectan a través de sus productos - Morfológicos: por ejemplo, color de flor - Bioquímicos: básicamente perfiles electroforéticos
de isoenzimas y de proteínas de reserva Genotípicos o moleculares: Los polimorfismos de genes u otras secuencias no codificantes se detectan a nivel del ADN
- Restricción + hibridación molecular (ejemplo, RFLP) - Amplificación por PCR (ejemplo, RAPD y microsatélites) - Restricción + PCR: (ejemplo, AFLP) - (re)Secuenciación directa, indirecta o parcial (SNP/GBS)
Tipos de
marcadores
genéticos
TIPOS DE MARCADORES:
“Neutros” Random DNA Markers (marcadores al azar)
derivados de cualquier parte del genoma,
fenotípicamente neutros (teóricamente asumidos
como tales para los programas bioestadísticos)
“Funcionales” Functional Markers (marcadores
funcionales)
sitios polimórficos dentro de genes afectando
causalmente la variación del carácter fenotípico.
Surgen como marcadores moleculares de las
regiones transcriptas/expresadas del genoma
Pueden no ser genotípicos: por ej el período de
aparición de moléculas defensivas (biomarcadores)
Para:
• Identificación (genotipificación) de hospe-
dantes o de patógenos
• Mapeo de genes y QTLs de resistencia
• Selección asistida por marcadores
• Clonado posicional de genes basado en mapa
• Estudios de variabilidad/diversidad genética en distintas
especies (plantas y fitopatógenos), germoplasma, identificación
de genotipos indicadores, etc
¿Para qué queremos usar
MM?
Volvamos a esta figura
Comparación
entre
marcadores
morfológicos
y moleculares
Marcadores
morfológicos
Influencia del ambiente
Bajo número
Baja cobertura del genoma
Bajo nivel de polimorfismo
Menos informativos
(dominantes o recesivos)
Caracteres de madurez
Entrenamiento y subjetividad
Sin influencia ambiental y
neutros
Cantidad ilimitada
Amplia cobertura del genoma
Alto nivel de polimorfismo
Más informativos
(en general codominantes)
Análisis en fases tempranas
Sencillos, rápidos y objetivos
Marcadores
moleculares
Sin embargo…. Hoy en día, a los morfológicos los empezamos
a llamar fenómicos
Mapa genético de tomate basado en marcadores morfológicos
Tomado de: Griffiths et al., An Introduction to Genetic Analysis, 2000.
• Isoenzimas
Grupo de múltiples formas moleculares de una misma
enzima presente en una misma especie, como resultado
de la presencia de uno o más genes que codifican cada
una de estas formas.
Las que son relevantes como marcadores genéticos son
las aloenzimas (o alozimas) que son variantes alélicas
del mismo gen (o locus) y que presentan una migración
electroforética diferencial.
Marcadores
bioquímicos:
isoenzimas
Ejemplo:
detección de
isoenzimas
de maíz
F isomerasa
Identificación de variantes isoenzimáticas. Se observan genotipos
homocigotas y heterocigotas para diferentes alelos en una población de
maíz analizada para dos loci isoenzimáticos (MDH y F isomerasa), lo que
revela la existencia de polimorfismos dentro de la misma.
Malato deshidrogenasa (MDH)
Gentileza de Instituto Nacional de Semillas, Argentina.
Perfiles electroforéticos de proteínas de reserva
de distintas variedades argentinas de avena.
Marcadores
bioquímicos:
Proteínas de
reserva
Gentileza de Instituto Nacional de Semillas, Argentina.
¿Se siguen usando?
¡Sí! Para registro y protección de variedades
comerciales
Marcadores
bioquímicos
Aunque tienen
algunos problemas
con el sindicato de
geles
Marcadores
genotípicos o
moleculares
basados en
la restricción
enzimática
del ADN Marcadores moleculares RFLP
Restriction Fragment Length Polymorphism
(polimorfismo de longitud de fragmentos
de restricción)
Mutaciones puntuales:
Ocurren en sitios de restricción.
Mutaciones estructurales:
Ocurren mediante inserciones, deleciones y rearreglos.
Origen del
polimorfismo
de los RFLPs
Adaptado de: Ferreira and Grattapaglia. Introdução ao uso de marcadores moleculares em análise genética, 1995.
Análisis utilizando RFLPs de los bulks resistente (R) y susceptble
(S) al virus PVX de Solanum commersonii empleando las enzimas
de restricción HinfI, DdeI, HindIII, DraI, EcoRI, XbaI y StyI (1 al 7).
Autoradiografía de los perfiles de RFLP obtenidos empleanado
la sonda s1+A/as1+T(584) marcada con radioactividad.
Perfiles de
RFLPs de
Solanum
commersonii
• Presentan bajo nivel de polimorfismo (en
comparación con otros marcadores
moleculares).
• Se requiere disponer de sondas específicas
para la especie en estudio.
• La utilización de radiactividad introduce altos
costos y problemas de bioseguridad.
• Requieren alta cantidad de DNA.
El procedimiento es laborioso y lento.
• ¡¡¡¡¡¡¡OBSOLETOS!!!!!!
Desventajas
de los RFLPs
Marcadores
moleculares
basados en la
amplificación
arbitraria
(o semi-
arbitraria)
del ADN Random Amplified Polymorphic DNAs
(polimorfismo de ADN amplificado al azar)
Marcadores moleculares RAPD
RAPDs Amplificación de ADN anónimo
con iniciadores de secuencia arbitraria
No permiten distinguir el heterocigota del homocigota dominante
Los RAPDs son marcadores genéticos dominantes
• La herencia es dominante (menor información
genotípica).
• Poseen problemas de
reproducibilidad.
• La interpretación de bandas presenta
dificultades.
• A medida que la distancia filogenética
aumenta, también aumenta la probabilidad de
que dos fragmentos de ADN diferentes
comigren y se cometan errores de cómputo
(no son confiables para comparación entre
especies distintas).
• Sólo se puede computar presencia compartida
de bandas y no la ausencia.
Desventajas
de los RAPDs
Amplified Fragment Length Polymorphism
(polimorfismo de longitud de fragmentos
amplificados)
Marcadores moleculares AFLP
Marcadores
moleculares
basados en la
amplificación
arbitraria
(o semi-
arbitraria)
del ADN
Procedimiento
para la
obtención
de AFLPs
AFLP fluorescentes
Detección de AFLPs usando durante la última etapa de amplificación iniciadores fluorescentes, resolviendo los fragmentos en un secuenciador
ABI3130XL
• Herencia dominante.
• Bajo contenido de información
genética por locus.
• Procedimiento medianamente
laborioso.
• Costo medio.
• Tecnología patentada (no es de
libre utilización).
Desventajas
de los
AFLP
Microsatélites
Repeticiones en tándem de secuencias cortas de
DNA de 1 a 10 pb de longitud
Ejemplos:
(GA)14
...GAGAGAGAGAGAGAGAGAGAGAGAGAGA...
(GAT)10
...GATGATGATGATGATGATGATGATGATGAT...
(CATC)8
...CATCCATCCATCCATCCATCCATCCATCCATC..
Sinónimos: SSLP, SSRP, SSR o STMS
Microsatélites
5’...TGACAGTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGCGA...3’
3’...ACTGTCACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCGCT...5’
16 repeticiones
5’...TGACAGTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGCGA...3’
3’...ACTGTCACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCGCT...5’
5’ GTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGC 3’
3’ CACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCG 5’
105 pb
iniciador
CTGCGATCAGCCCATCATCG 5’
5’ GTGGGTCACGACTTGAGCCAG
iniciador
PCR con iniciadores específicos
Producto de amplificación obtenido
Electroforesis en gel de poliacrilamida
desnaturalizante
Origen del polimorfismo de los microsatélites
Microsatélites en diploides
1
2
3
1 2 3
(+)
Los microsatélites son marcadores codominantes
Ejemplo: variedades de soja (Glycine max)
analizadas mediante SSR
Patrones obtenidos para 43 variedades de soja. Gel de poliacrilamida teñido con plata.
Gentileza Dra. S. Giancola.
Métodos de separación / detección
Agarosa/bromuro de etidio Poliacrilamida / nitrato de plata
Gentileza Lic. V. Nishinakamasu y Dra. N. Paniego
Gentileza Lic. P. Talia y Dra. N. Paniego
Radiactividad
Gentileza Lic. V. Nishinakamasu y Dra. N. Paniego
Fluorescencia
Tomado de : www.fsl.orst.edu/ tgerc/risk.htm
Marcación de marcadores moleculares con fluoróforos
Empleo de
secuenciador
automático
Homocigota alelo 1
Pico 147-149 pb
Homocigota alelo 2
Pico 153-155 pb
Heterocigota:
ambos alelos
Electroferogramas para 3 genotipos de sorgo
Gentileza Téc. L. Fernández
• Polimorfismo muy elevado (multialélicos)
• Enorme número de loci
• Herencia mendeliana codominante
• Interpretación sencilla de los resultados
• Reproducibilidad muy alta
• Resultados transferibles entre laboratorios
• Automatización
Ventajas
de los
microsatélites
• Se requiere conocer la secuencia nucleotídica
involucrada alto costo para desarrollar los primers
(oligonucleótidos iniciadores)
- Inicialmente lentos
- Inicialmente costosos
• Unilocus (aunque pueden hacerse multiplex)
• Alta tasa de mutación que puede afectar la
reproducibilidad en estudios genealógicos.
Desventajas
de los
microsatélites
SNP + (re)secuenciación
(ej. GBS)
• Diversidad nucleotídica: 90% de la variación del
genoma en cualquier organismo
• En general son bialélicos, aunque por definición
puede haber 4 variantes
• Ubicuos: pueden estar en cualquier región del
genoma
• Se encuentran cada 100 a 300 pb
• Estables
• Pueden ser funcionales si están en regiones
codificantes.
• Fáciles de procesar bioinformáticamente
SNPs Indels (Insertions/Deletions)
Caracterís-
ticas de los
SNPs
Ventajas y
desventajas
de los
marcadores
SNP
• Ventajas:
- Baja tasa de mutación (mayor estabilidad que los SSR)
- Muy abundantes
- Fáciles de analizar por métodos bioinformáticos
- Desarrollo continuo de nuevas metodologías analíticas
para su detección
- Simplificación de los estudios comparativos cruzados.
• Desventajas: - En la mayoría de los métodos, se requiere conocer la
secuencia nucleotídica involucrada
- Costosos de aislar y caracterizar (secuenciación)
- Bajo contenido de información para un único SNP
Técnicas para la detección de SNPs
Costo
Sensibilidad
Especificidad
Número de muestras a analizar
Posibilidad de automatización
Equipamiento necesario
Dificultad del ensayo
Intensa actividad comercial en este área
Detección
de SNPs:
métodos
de análisis
Métodos para pocas muestras (diagnósticos)
para uno o pocos loci
PCR de tiempo real
Secuenciación por Sanger
Métodos de análisis masivo de todo el
genoma
Microarreglos de DNA
Nanotecnología
Secuenciación en paralelo por NGS
Detección
de SNPs:
métodos
de análisis
PCR en tiempo real: sistema TaqMan Detección
de SNPs:
métodos
de análisis
Detección
de SNP
empleando
sondas
TaqMan®
para cada
alelo
Química de la discriminación alélica
La sonda sólo hibrida con la secuencia blanco si existe complementariedad
perfecta de bases. Así, la sonda marcada con FAM sólo reconoce al alelo 2 (AT)
y la sonda marcada con VIC sólo reconoce al alelo 1 (GC). Ambas sondas se
colocan en la misma reacción de PCR y, de acuerdo con el alelo presente, se
obtienen señales fluorescentes para uno u otro fluorocromo. En un individuo
heterocigota se puede detectar la señal correspondiente a ambos alelos.
Fig. 1 Example of intraspecies polymorphism of the ITS. The part of sequences of two different clones of
M. bovis (a, b) and Mycoplasma conjunctivae (c, d) are present.
Appl Microbiol Biotechnol (2006) 71: 680–698. Sequence of the intergenic 16S-23S rRNA spacer (ITS) regionof
Mollicutes species and their identification using microarray-based assay and DNA sequencing.
Métodos para pocas muestras (diagnósticos)
PCR de tiempo real
Secuenciación por Sanger
Métodos de análisis masivo
Microarreglos de DNA
Nanotecnología
Secuenciación en paralelo por NGS
Detección
de SNPs:
métodos
de análisis
¡En la práctica es una resecuenciación!
Appl Microbiol Biotechnol (2006) 71: 680–698. Sequence of the intergenic
16S-23S rRNA spacer (ITS) regionof Mollicutes species and their
identification using microarray-based assay and DNA sequencing.
Nanotecnología
Unión de un clon a una microesfera
PCR en emulsión
Análisis de fragmentos fluorescentes amplificados mediante una PCR alelo-específico
multiplexada.
R Tuberosa. 2nd National Workshop on Marker-Assisted Selection for Crop Improvement . ICRISAT
Genotipificación Marcadores moleculares tradicionales de (SSR, RFLP, AFLP, etc):
- Bajo rendimiento o low- throughput: número de marcadores
alrededor de 100.
- Desarrollo y descubrimiento es costoso y requiere de tiempo
- SSRs son especie específicos.
- Baja capacidad de multiplexado.
“The ideal molecular approach for population genomics should uncover
hundreds of polymorphic markers that cover the entire genome in a
single, simple and reliable experiment. Unfortunately, at present there is no
such approach.” Luikart et al 2003
(Davey et al, 2011)
SNP arrays de alto rendimiento
- High throughput: pero “solo” miles de marcadores
- La producción de una matriz de alta calidad requiere una
inversión sustancial de los recursos.
- Conocimiento previo de secuencias.
- Específicos de la población con la que los desarrollaron.
- Evaluación de uno o dos individuos a la vez.
NGS marker discovery and genotyping methods
- High throughput: miles a cientos de miles de marcadores
- Descubrimiento o desarrollo de nuevos marcadores
- Secuenciación y genotipificación simultánea
- Decenas o centenas de individuos
- Sin conocimiento previo de secuencias
En un sólo
ensayo!
Genotipificar en la era del NGS
Cómo reducir costos secuenciando
solo lo necesario Para estudios de poblaciones:
Resecuenciación de genomas:
Especies con genoma de referencia:
• Secuenciación del genoma a baja profundidad (<30X) para descubrir
SNPs en muchos individuos es costosa e innecesaria.
Especies sin genoma de referencia:
• La secuenciación y ensamblado del genoma de un individuo de novo es
un gran desafío, y costoso.
Genotipificar reduciendo la representación:
•Secuenciar sólo la región de interés de cada individuo: menor costo
•Más sencillo el análisis bioinformático de datos
•Menor tiempo
•Para especies con o sin genoma de referencia
Restriction site-associated DNA sequencing (RAD-Seq) (Baired
et al., 2008)
Reduce Representation Libraries (RRLs)
Complexity reduction of polymorphic sequences (CRoPS)
Restriction fragment sequencing (RESTseq)
Multiplexed shotgun genotyping (MSG)
EzRAD
Sequence-Based Genotyping (SBG)
2b-RAD
Genotyping by Sequencing (GBS) (Elshire et al., 2011)
Más populares:
Double digest Restriction site-associated DNA sequencing
(ddRAD-Seq) (Peterson et al., 2012)
1. Digestión de ADN genómico de muchas muestras
2. Selección o reducción de los fragmento de PCR resultantes
3. NGS del subconjunto de fragmentos (< a 1000pb)
Los polimorfismos de los fragmentos secuenciados se utilizan como marcadores moleculares.
Pasos en comunes a todos los protocolos
RADseq
Digestión
Ligación adaptadores-index
Pool
Corte al azar
Selección de tamaños
Ligación adaptadores Y
PCR
Lectura SE (50pb)
GBS
Digestión
Ligación adaptadores-index
Pool
PCR
Lectura SE 86pb (48 o 96plex en
GA)
RADSe
q
GBS
Truong HT, et al. (2012) Sequence-Based Genotyping for Marker Discovery and Co-Dominant Scoring in Germplasm and Populations.
PLoS ONE 7(5): e37565. doi:10.1371/journal.pone.0037565
ddRAD-Seq
Digestión doble
Ligación adaptadores-
barcode
Pool
Selección de tamaños
PCR-index
Lectura PE 125pb
• Elimina el corte por azar
- Se reduce 5 veces el costo de preparación de libraries en comparación con RAD-Seq
• Size Selection preciso
- Reduce duplicados de las regiones a secuenciar
- Profundidad de lectura similar entre individuos en cada región del genoma
ddRAD-Seq
GBS:
bioinformática
para la
identificación y
anotación de
marcadores
asociados
MEJORAMIENTO VEGETAL - TECNICAS CLÁSICAS
OBJETIVOS a) Obtener un mayor rendimiento agronómico b) Mejorar la calidad del producto c) Aumentar la seguridad de cosecha CARACTERÍSTICAS GENERALES a ) Acumulativo: las nuevas mejoras se suman a las anteriores
b) Continuo: debido a que siempre se exige más – cambios de hábitat – cambios en las técnicas de cultivo – cambios en los mercados compradores – cambios en las poblaciones de fitopatógenos
c) Competitivo: las nuevas variedades deben superar a las ya difundidas (ensayos comparativos de rendimientos — ECR) CONSIDERACIONES RESPECTO DE LA ESPECIE Y EL CARÁCTER A MEJORAR a) Modo de reproducción (alogamia, autogamia o agamia). Biología floral, sistemas de autoincompatibilidad, etc. b) Cantidad de genes y momento de expresión. c) Tiempo por generación d) Número de cromosomas y nivel de ploidía e) Otros: Condiciones de crecimiento, resistencia a enfermedades, etc.
Genética cuantitativa clásica Generación parental
Progenie
Ganancia
Diferencial de
Selección Parentales
seleccionados
Selección masal
DOMESTICACIÓN del TOMATE y el MAÍZ
Selección masal
F2
P2
F1
P1 x
Grandes poblaciones segregantes con
miles de recombinantes
SELECCION FENOTÍPICA
Mejoramiento convencional
Resistencia a estrés hídrico Resistencia a enfermedades Deficiencia nutricional
Diapositiva del IRRI Tomado de Bert Collard & David Mackill
Los métodos de
mejoramiento se
basan en los mismos
fundamentos
conceptuales que los
vistos en Genética I
F2
P2
F1
P1 x
Grandes poblaciones segregantes con
miles de recombinantes
SELECCION FENOTÍPICA
¿Y qué es lo moderno?....... Repasemos: mejoramiento convencional
Resistencia a estrés hídrico Resistencia a enfermedades Deficiencia nutricional
Diapositiva del IRRI
F2
P2
F1
P1 x
Grandes poblaciones segregantes con
miles de recombinantes
Resistente Susceptible
Selección asistida por Marcadores Moleculares (MAS)
Mejoramiento asistido por marcadores
En este esquema, la selección “fenotípica” se basa en marcadores
moleculares
Diapositiva del IRRI Tomado de Bert Collard & David Mackill
Ventajas del MAS • Método más sencillo
- comparado con la selección fenotípica si la evaluación de la característica fenotípica es laboriosa o compleja (recesiva, epistática, compleja como contenido de proteínas)
• La selección se realiza a nivel de plántula
– Importante para características como calidad del grano
• Aumenta la confiabilidad
– Se independiza de efectos ambientales
– Permite discriminar entre homcigotas y heterocigotas y seleccionar plantas individuales
Desventajas II
• Recursos
– Equipamiento, personal calificado
• Costos!!!!
• Conocimiento de los caracteres a seleccionar (posición en el mapa genético: disponer de marcadores ligados)
¿Cómo hacemos para mapearlos?
Identificación de regiones genómicas asociadas a caracteres de interés
Diapositiva gentilmente cedida por Ing. Gabriela Pacheco
Mapeo de QTLs
Mapeo de QTLs
Mapeo de Asociación y Genome-Wide Association Studies (GWAS)
Diapositiva gentilmente cedida por Ing. Gabriela Pacheco
DL
• Desequilibrio de ligamiento
Las flechas indican marcadores con asociación estadística significativa
Mapeo por asociación •Estrategia alternativa al mapeo de ligamiento.
•Ambos detectan asociaciones entre genotipos y fenotipos basados en la coheredabilidad de polimorfismos.
Mapeo de ligamiento Mapeo por asociación
Zhu 2008
•Parentales con fenotipo contrastantes para el carácter •Número limitado de eventos de recombinación •Baja resolución (pero mayor probabilidad de encontrar marcadores ligados)
•Población natural •Múltiples eventos de recombinación debido a la historia de la población •Alta resolución (pero menor probabilidad de encontrar marcadores ligados)
Mapeo por Asociación para la Podredumbre Húmeda del Capítulo en girasol
Evaluación fenotípica (Y)
• Se evaluó la incidencia de PHC en cada ensayo y se obtuvo la media ajustada para cada línea endocriada.
• Las LE se comportaron de manera diversa frente a la enfermedad.
• 52% de las líneas mostraron un comportamiento intermedio frente a PHC.
Y = G + Q ó P/K + E
Analisis estadístico Alelos asociados
Y = G + Q ó P/K + E
500
1000
Inci
de
nce
Candidate gene haplotypes
Un haplotipo de RhoBP_B mostró asociación significativa con una menor incidencia de PHC.
•Las estructura del gen RhoBP_B está caracterizada por 4 exones y 3 intrones.
•El genotipo 3:3 amplifica un fragmento de mayor tamaño.
RhoBP_B se ubicó en el GL11
¿Cómo se hace un GWAS/EWAS?
GWAS (Manhattan Plot) Esclerosis sistémica en humanos
Radstake y col. 2010