historia biologia evolutiva

17
Tema 1: Conceptos básicos de evolución molecular y filogenética Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1 © Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 1 Biología Genómica y Evolución IV - Inferencia Filogenética y Evolución Molecular Pablo Vinuesa ([email protected] ) Progama de Ingeniería Genómica, CCG-UNAM, México http://www.ccg.unam.mx/~vinuesa/index.html Profesor Asistente: Agustín Avila : [email protected] Tema I: Conceptos b ásicos de evolución molecular y filogenética 1. Breve introducción histórica del desarrollo de la biología evolutiva y de su impacto en la sociedad occidental y en nuestra percepción del mundo 2. ¿Porqué estudiar filogenética y evolución molecular? 3.- Tipos de datos usados en filogenética y evolución molecular 4.- Protocolo básico para el análisis filogenético de secuencias moleculares 5.- Tasas de evolución y selección de marcadores 6.- Qué es un árbol filogenético y tipos de árboles : una visón del “bosque” 7.- Definición de homología y tipos de homología 8.- Presentación de los tipos de métodos de reconstrucción filogenética 1. Antes de Darwin Tema I: Breve historia de la biología evolutiva y filogenética • La filosofía y visión occidental del mundo estubierondominadas durante muchos siglos por las ideas del gran filósofo griego Platón (428-348 AC) y su discípulo Aristóteles (348-322 AC). • Uno de los pilares de la filosofía platónica es el concepto de la “eidos”, la forma o la idea, una forma transcendenteideal imitada de maneraimperfecta por sus encarnaciones terrenales. En el contexto de esta filosofía esencialistala variación o diversidad biológica se interpretaba como imperfección accidental. Arist óteles desarrolló el concepto platónico de inmutabilidad de las esencias proponiendo el concepto de que las especies tienen propiedades fijas. Platón (izda.) y Aristóteles (dcha.) 1. Antes de Darwin Tema I: Breve historia del desarrollo de la biología evolutiva y filogenética El jardín del Edén, por Jan Breughel (1568-1625). • Más tarde los cristianos interpretaron literalmente el Génesis, concluyendo que cada especie fuecreada individualmente “a imagen y semejanza” del Creador, en la forma en la que las conocemos hoy. A esta creencia se la conoce como “creación especial ”. • En la creenciay filosofía cristianase asume que el orden es un estadosuperior al desorden y que por lo tantolas creaciones divinas siguen un plan: una gradación que va desdeobjetos inanimados y formas “mínimamenteanimadas”, progresandoa traves de plantas e invertebrados hacia formas cada vez “más elevadas” de vida. • Esta scala naturae culmina con el humano, la única criaturacon naturalezadual: física y espiritual. • El cristianismo asume que la escalanatural es permanentee inmutable, ya que la posibilidad de cambio implicaría la existencia de imperfección en la creación original. Los naturalistas han tratado de detectar , describir y explicar la diversidad biológica desdemuchos siglos atrás. Este es el objetivo de la sistemática. En 1758 Carl von Linne (Carolus Linnaeus) formalizó un sistema jer árquico de nomen- clatura para clasificar a los organismos (sistema binomial ) en s u Systema Naturae (1735). Esta jerarquía fue concebida indepen- dientementede la teoría evolutiva y preten- día revelar el orden natural o patrón impl ícito en el plan del Creador. Tema I: Breve historia de la biología evolutiva y filogenética De hecho hasta el S. XVIII el papel d e las ciencias naturales era catalogar y hacer manifiesto el plan del Creador paraque pudiéramos apreciar su sabiduría infinita.

Upload: germangabrielumana

Post on 19-Jan-2016

42 views

Category:

Documents


1 download

DESCRIPTION

Historia Biologia Evolutiva

TRANSCRIPT

Page 1: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 1

Biología Genómica y Evolución IV -Inferencia Filogenética y Evolución Molecular

Pablo Vinuesa ([email protected])Progama de Ingeniería Genómica, CCG-UNAM, México

http://www.ccg.unam.mx/~vinuesa/index.htmlProfesor Asistente: Agustín Avila : [email protected]

Tema I: Conceptos b ásicos de evolución molecular y filogenética

1. Breve introducción histórica del desarrollo de la biología evolutiva y de

su impacto en la sociedad occidental y en nuestra percepción del mundo

2. ¿Porqué estudiar filogenética y evolución molecular?

3.- Tipos de datos usados en filogenética y evolución molecular

4.- Protocolo básico para el análisis filogenético de secuencias moleculares

5.- Tasas de evolución y selección de marcadores

6.- Qué es un árbol filogenético y tipos de árboles : una visón del “bosque”

7.- Definici ón de homolog ía y tipos de homología

8.- Presentación de los tipos de métodos de reconstrucción filogenética

1. Antes de Darwin

Tema I: Breve historia de la biología evolutiva y filogenética

• La filosofía y visión occidental del mundo estubieron dominadas durante muchos siglos

por las ideas del gran filósofo griego Platón (428-348 AC) y su disc ípulo Aristóteles

(348-322 AC).

• Uno de los pilares de la filosofía platónica es el concepto de la “eidos”, la forma o la

idea, una forma transcendenteideal imitada de manera imperfecta por sus encarnaciones

terrenales. En el contexto de esta filosofía esencialistala variación o diversidad

biológica se interpretaba como imperfección accidental. Aristóteles desarroll ó el

concepto platónico de inmutabilidad de las esencias proponiendo el concepto de que las

especies tienen propiedades fijas.

Platón (izda.) y Aristóteles (dcha.)

1. Antes de Darwin

Tema I: Breve historia del desarrollo de la biología evolutiva y filogenética

El jardín del Edén, por Jan Breughel (1568-1625).

• Más tarde los cristianos interpretaronliteralmente el Génesis, concluyendo que cadaespecie fue creada individualmente “a imageny semejanza” del Creador, en la forma en la que las conocemos hoy. A esta creencia se la conoce como “creación especial ”.

• En la creencia y filosof ía cristiana se asumeque el orden es un estadosuperior al desorden y que por lo tanto las creacionesdivinas siguen un plan: una gradación que vadesdeobjetos inanimados y formas“mínimamenteanimadas”, progresandoa traves de plantas e invertebrados haciaformas cada vez “más elevadas” de vida.

• Esta scala naturae culmina con el humano, la única criatura con naturalezadual: físicay espiritual.

• El cristianismo asume que la escala natural es permanentee inmutable, ya que la posibilidadde cambio implicaría la existencia de imperfección en la creación original.

Los naturalistas han tratado de detectar , describir y explicar la diversidad biológicadesdemuchos siglos atrás. Este es el objetivo de la sistemática.

En 1758 Carl von Linne (Carolus Linnaeus)formalizó un sistema jer árquico de nomen-clatura para clasificar a los organismos(sistema binomial) en su Systema Naturae(1735). Esta jerarquía fue concebida indepen-dientementede la teoría evolutiva y preten-día revelar el orden natural o patrón impl ícitoen el plan del Creador.

Tema I: Breve historia de la biología evolutiva y filogenética

De hecho hasta el S. XVIII el papel d elas ciencias naturales era catalogar y hacermanifiesto el plan del Creador para quepudiéramos apreciar su sabiduría infinita.

Page 2: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 2

Tema I: Breve historia de la biología evolutiva y filogenética

La interpretación bíblica literal comenzó a ser cuestionada y reemplazadacuando en el S. XVII comenzaron a surgir visiónes más materialistas del mundo natural, notablemente con los Principia Mathematica de Isaac Newton(1643-1727) que describen las leyes de la gravitación universal y las leyes del movimiento, sentandolas bases de la mecánica clásica. Fue el primero en demostrar que estas leyes del movimiento y gravitación aplican igual a la Tierra como al resto del universo. El poder unificador y predictivo de sus leyesfuerondecisivas para permitir la culminación de la Revolución Científica iniciadaen 1543 por Nicolaus Copernicus con su De revolutionibus orbium coelestium, sentando así pilares fundamentales de la ciencia moderna.

Fueron los descubrimientos en astronomía y geología hechos en los siglos XVIII y XIX los que sentaron las bases decisivas para el nacimiento de las ideasevolutivas. Particularmente importante fue el trabajo del geólogo escocésCharles Lyell (1797-1875), quien expuso el principio del uniformitarismo.Este se basa en reconocer que los mismos procesos geológicos reconocidos enel presente operaban en el pasado, y que por lo tanto las formaciones geológicasse pueden explicar por causas observadas en el presente.

Lyell tuvo una gran influencia en el pensamientode Charles Darwin, quienadoptó el uniformitarismo en su pensamiento evolutivo.

En el S. XVIII varios naturalistas y filósofos franceses sugirieron que lasespecies biológicas hab ían surgido por causas naturales.

Evolucionistas tempranos como George Louis Buffon (1753) ya se opon ían al sistema linneano y al esencialismoaristotélico en el que se basaba el ordennatural lineano.

Tema I: Breve historia de la biología evolutiva y filogenética

La hipótesis evolutiva pre-darwiniana más significativa fue sin dudala formulada por Chevalier de Lamarck en su Philosophie Zoologique(1809).

La teoría lamarckiana proponía que cada especie se originaba pormedio de la generación espontánea a partir de materia inanimada,comenzandoas í en la base de la “cadena del ser ”. El suponía quedentro de cada especie actuaba un “fluido nervioso” que la hacíaprogresar ascendiendo la cadena. Asumía que las alteraciones corporales adquiridas durante el lapso devida de un individuo se heredaban, sentando las bases del principioconocido como “herencia de caracteres adquiridos”.

Charles Darwin, 1854

Charles Robert Darwin (1809-1882) fue un naturalista inglés quecomenzó a estudiar medicina y luego la carrera de clérigo en la Univ.de Cambridge (UK) antes de embarcarse en un viaje alrededor delmundo a bordode la H.S.M. Beagle (1831-36), que la marina británicaenviaba para cartografiar las costas de Sudamérica. El fue invitadocomo naturalista y acompañante del Capitán Fitz Roy. Este viaje nosólo cambiaría la vida de Darwin, sino que revolucionó radicalmente el pensamiento occidental al presentar evidencia contundentede que lasespecies biológicas han evolucionado a partir de ancestros comunes.

Darwin se convenció de ello durante el viaje del Beagle. Consciente dela importancia y repercusiones de su descrubrimiento , pasó 20 añosrecopilando evidencias antes de hacer públicas sus ideas.El 1 de Julio de 1858 Charles Darwin propuso su teor ía de la evolución por medio de la selección natural en una reunión de laSociedad Lineana de Londres. Su tratado monumental “EL origen de las especies” fue publicado un año después. El día de su publicaciónel libro qued ó agotado.Su libro no sólo revolucionó el pensamiento biológico, sino tambiénla política, sociología y la filosofía moral de occidente.

Tema I: Breve historia de la biología evolutiva y filogenética

El punto más d ébil en la teor ía Darwiniana era suincapacidad de explicar cómo surgían y cómo se transfer íanlos caracteres hereditarios de generación en generación

Darwin escribió una serie de ensayos privados en 1844 y en1856 comenzó un libro que quería titular Natural Selection.Nunca lo terminó ya que en 1858 Darwin (dcha.) recibió un manuscrito de un joven naturalista, Alfred Russel Wallace(1823-1913) en el que quedaba claro que había descubiertode manera independiente el principio de la selección natural.Esta carta fue la que lo motivó a presentar su famosaplática ante la Soc. Linneanade Londres en 1858, basada enpartes de sus ensayos y en la carta enviada por Wallace.Seguidamente pasó a escribir un “resumen o abstract” de 490 páginas de su manuscrito Natural Selection, el cual fuepublicado en 1859 en Londres bajo el t ítulo de:On the Origin of Species by Means of Natural Selection, or the Preservation of Favoured Races in the Struggle for Life

Tema I: Breve historia de la biología evolutiva y filogenética

Page 3: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 3

Siete años después de la publicación del Origen de las Especies (1866), el monjeagustino austriaco Gregor Mendeldescribe sus trabajos con cruzasde arvejas titulado “Versucheüber Pflanzenhybride”, en el que establece la existencia de “caracteres elementales de la herencia” y describe leyesestadísticas que gobiernan su transmisión de generación en generación. El no sabía si estos caracteres elementales tenían una base material o meramenterepresentaban “interacciones vitales”

En 1869, Johann Friedrich Miescher , un químico suizo, descubre una sustan-cia ácida rica en P en células espermáticas, a la que llamó nucleína. Llegó aespecular sobre su posible relación con la herencia , pero pronto abandonóesta “idea absurda”.

Darwin, Mendel y Miescher no podían imaginar lo conectados que susrespectivos descubrimientos estarían 100 años después ...

En 1944 Oswald Averydemuestra que el DNA es el material hereditario(y no las proteínas como se pensaba). Incluso llega a especular que losgenes están hechos de DNA.

http://profiles.nlm.nih.gov/CC/Views/Exhibit/narrative/biographical.htmlAvery, Oswald T., Colin M. MacLeod, and Maclyn McCarty . Studies on the Chemical Nature of the Substance InducingTransformation of Pneumococcal Types. J. Exp. Med. 79, 2 (February 1, 1944): 137-158.

Tema I: Breve historia de la biología evolutiva y filogenética

Entre1930 y 1950 T. Dobzhansky , G. Simpson, E. Mayr y G. Stebbins fusionan las teor íaspropias de las disciplinas de genética , paleontología, zoolog ía y botánica bajo la luz de la teoría evolutiva en lo que se vino a conocer como la nueva s íntesis.

TheodosiusDobzhansky

George Simpson Ernst Mayr G. LedyardStebbins

Tema I: Breve historia de la biología evolutiva y filogenética

En las décadas de 1930-40 Ronald A. Fisher, JBS Haldane y Sewall Wright sientan las bases de la teor ía de genética de poblaciones ,desarrollando además muchos de los índices estadísticos usadospara estimar la intensidad de fuerzas evolutivas como la deriva,selección, mutación y migración. Nace la Síntesis Evolutivao Síntesis Moderna. En esencia clarifica que la mutación y selec-ción natural actúan conjuntamente para causar evolución adaptativa .

Tema I: Breve historia del desarrollo de la biología evolutiva y filogenética

Algunos creacionistas afirman que el diluvio universal fue el responsablede la aparición de todos los fósiles y formacionesgeológicas sobre la tierra. Afirman que la tierra se formó en exactamente6 días(un 23 de Octubre del 4004 adC, segúnestimó el obispo James Ussher, SXVII).Los geólogos abandonaron esta visión hacemás de 300 años. Se trata de cristianosfundamentalistas que hacen una lecturaliteral del Génesis para explicar la historiade la vida en el planeta Tierra.

Desafortunadamente, muy poco de estosavances fundamentales en el desarrollomodernode la teor ía evolutiva sali ó a la luzpública en USA entrelos 1940-60 por la presión que ejerc ían los “creacionistas” en sobre los editores de libros de texto, obligándolos a evitar cualquier mención de evolución en libros de biología. Por miedo a perder negocio, las editoriales cedieron a estas presiones.

No fue hasta los 60´s que se revirtió el problema. En parte debido al éxito de la cienciasoviética por el lanzamientodel primer satéliteSputnik en 1957. Ello creó una oleada depánico a través de sectores de la cienciaamericana , incluída la biología evolutiva. En 1967, la legislaturadel estadode Tennessee vuelva a permitir la mención de evolución.

La cronología de la creación y otros eventos importantes

recopilados en la “historia bíblica” de la Tierra,

según el Arzobispo anglicano de Armagh (Irlanda), James Ussher— J. Ussher, The Annals of the World iv (1658)

Fuentes: http://en.wikipedia.org/wiki/Ussher_chronologyhttp://www.lhup.edu/~dsimanek/ussher.htm

Ussher's history of the Earth:

4004 BC - Creation (23 de Octubre, Domingo)4004 BC – Adam and Eve weredriven from Paradise on Monday 10 November 4004 BC2348 BC - Noah's Flood ; the ark touched down on Mt Ararat on 5 May 2348 BC (Wed)1921 BC - God's call to Abraham1491 BC - The Exodus from Egypt1012 BC - The founding of the Temple in Jerusalem586 BC - Thedestruction of Jerusalem by Babylon

and the beginning of the Babylonian Captivity4 BC - Thebirth of Jesus

Page 4: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 4

En 1953 Francis Crick y James Watson publican en Nature sumodelode la estructua en doble hélice del DNA. Se abre con ello la vía para el nacimiento de la evolución molecular.

Emile Zuckerkandl fue junto con Linus Pauling uno de los pioneros de la disciplinade la evolución molecular , al descubrir que las moléculas de DNA y las proteínasque codifican son “documentos de la historia evolutiva” dada la relativa constanciacon la que acumulan variaciones (mutaciones). Ambos publican un paper históricoen 1965 proponiendo formalmentela existencia de un reloj molecular

A finales de los 60 ’s el genetista matemático Motoo Kimuracombina losprincipios teóricos de la genética de poblaciones con los nuevos conoci-mientos de biolog ía molecular para desarrollar la teoría neutral deevolución molecular (1968), en la que la deriva genética es la principalfuerza evolutiva que afecta al cambio en las frecuencias alélicas.

Tema I: Breve historia del desarrollo de la biología evolutiva y filogenética

Filogeniay clasificaciónde la vida tal y como lapropusoErnst von Haeckelen 1866

Los primeros intentos de reconstruírla historia filogenética estaban basadosen pocos o ningún criterio objetivo.

Reflejaban las ideas o hipótesis plausiblesgeneradas por expertos de grupostaxonómicos particulares.

La mayor parte de la 1a. mitaddel SXX los sistemáticos estabanmás preocupados por el problemade definir a las especies biológicas,descubrir mecanismos de especiacióny la variación geográfica de las espe-cies, que en entender su filogenia.

No fue hasta los 40´s y 50’s que losesfuerzos de individuos como WalterZimmermann y Willi Henningcomenzaron a definir métodosobjetivos para reconstruir filogenias enbase a caracteres compartidos entreorganismos fósiles y contemporáneos.

Tema I: Breve historia del desarrollo de la biología evolutiva y filogenética

En la década de los 60’s estos métodos objetivos para estimar filogeniasse refinan y se desarrollan criterios explícitos como el de la taxonomíanumérica (Peter Sneath y Robert R. Sokal, 1963). Desarrollan métodosde agrupamiento basados en matrices de distancias como el UPGMA

Robert R. Sokal

Luca Cavalli-Sforza (parado) y Anthony Edwards colaboraron en la décadade los 60’s en la Universidad de Pavia, Italia, para fundar la disciplinade filogenética numérica, concibiéndola como un problema de inferenciaestadística. Introdujeron los métodos de parsimonia, verosimilitud y dematrices de distancias para inferir filogenias.

Tema I: Breve historia del desarrollo de la biología evolutiva y filogenética

A la par que se acumulaban nuevas secuencias de proteínas y se desarrollaban métodos es-tadísticos para inferir filogenias y patrones de evolución molecular, la biología moleculardesarrola métodos cada vez más eficientes de secuenciación de proteínas y ácidos nucléicos

Frederick Sanger desarrolla técnicas muy eficientes de secuenciaciónde proteínas (1955) y DNA (dideoxy chain termination, 1975).Recibedos premios nobel en química.

Tema I: Breve historia del desarrollo de la biología evolutiva y filogenética

Page 5: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 5

En los 60’s se contaba con unas reducida base de datos de secuenciasde proteínas globulares. Margaret Dayhoff fue la primera en comenzara construir una base de datos de secuencias y de inferir propiedadesestadísticas del proceso de sustitución. Describen las matrices PAM.Además introduce métodos computacionales de parsiminoa para calcularárboles de secuencias de proteínas.

En 1967 Walter Fitch y EmanuelMargoliash publican una filogeniade proteínas de citocromo Cbasada en un método de matricesde distancias y un algoritmo parasu representación en forma de un árbol filogenético usandoel métodos de los mínimos cuadrados.

Walter Fitch

Tema I: Breve historia del desarrollo de la biología evolutiva y filogenética

En 1993 Kary B. Mullis gana el premio Nobel de bioquímica por sumétodo de amplificación enzimática de DNA (PCR).

Science, 1985 Dec 20, 230(4732):1350-4.

Los protocolos de PCR disparan la generación de secuenciasy el desarrolo de nuevas metodolo-gías, tales como la generaciónde fingerprintes genómicos de diversos tipos, tales comoAFLPs, PCR-RFLPs, RAPDs ...

Nuevos métodos de secuenciaciónse basan en tecnolog ía de PCR.

Tema I: Breve historia del desarrollo de la biología evolutiva y filogenética

¿Qué estudian la sistemática y evolución molecular? : conceptos básicos

- La sistemática y evolución molecular engloban a un conjunto muy amplio de herramientas y modelos bio-estadísticos que nos permiten estudiar la “arqueología molecular” de los organismos, es decir, el registro evolutivo escrito en el material hereditario (DNA) y en susproductos (proteínas y RNAs estructurales, anatomía etc.), con el fin de poder hacerinferencias sobre:

1. Las relaciones ancestro-decensdiente(filogenéticas) de dominios de prot., genes y organismos. Las hipótesis filogenéticas resultantes son la base para hacer predicciones (inferencias) sobrepropiedades biológicas de los grupos revelados por la filogenia medianteel mapeo de caracteressobre la topología (hipótesis evolutiva).

2. Estimar la intensidad y papel de las fuerzas evolutivas (selección, deriva, migración, recombinación) en el modelaje de la estructura de dominios protéicos, genes, poblaciones ygenomas (evolución molecular).

La sistemática molecular usa marcadores genéticos para hacer inferencias sobreprocesos que acontecen en las poblaciones y para reconstruir su filogenia. Así se generangrandes bases de datos de secuencias de genes espec íficos para una gran cantidad de especies y organismos.

Los estudios de evolución molecular usan estos sets de datos para evaluar tasas , procesos y constriccioes en el cambio molecular a lo largo del tiempo. Los resultados de estos estudiosde evolución molecular a su vez proveen de nuevos criterios para la selección más informadade marcadores moleculares para estudios filogenéticos y de genética de poblaciones .

- Buena parte de la bioinformática y genómica es esencialmentebiolog ía comparada:predicciones basadas en comparación de motivos, secuencias, genomas y estructurasmoleculares

- Los organismos y sus componentes estructurales tienen una historia evolutiva=> la filogenética yace en el corazón de la biología comparada

- Comparaciones basadas en filogenias moleculares pueden proporcionar importantesdescubrimientos difíciles de hacer mediante otras aproximaciones:

- elucidación del árbol (red?) universal- distinción entre ortólogos, parálogos y xenólogos y descubrimiento de funcionali-

dades diferenciadas entreellos ; clasificación y anotación de familias (multi)génicas- guía de alineamientos múltiples de nt y aa;- guía para modelajes estructurales de RNAs y proteínas- …

¿Porqué estudiar filogenética y evolución molecular? : conceptos básicos

Page 6: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 6

La relación entre filogenética y evolución molecular:

• La filogenética tiene por objetivo el trazar la relación ancestro descendiente de losorganismos (árbol filogenético) a diferentes niveles taxonómicos, incluyendo el árbol

universal, haciendo una reconstrucción de esta relación en base a diversos caractereshomólogos (adquiridos por descendencia directa), tanto morfológicos como moleculares

• Gracias a la cantidad masiva de secuencias disponibles en las bases de datos (inclu-yendo centenas de genomas completos !) y la disponibilidad de sofisticados modelos de evolución de secuencias y de su implementación en programas de cómputo muy eficientes,las filogenias moleculares son indispensables para examinar todo tipo de cuestionesevolutivas .

• El desarrollo de métodos de simulaci ón de secuencias y rigurosos marcos de filogenética estad ística, tanto frecuentistas y Bayesianos, permiten hacer contrastes de hipótesis en un contexto evolutivo!

• La evolución molecular estudia los mecanismos y procesos que han llevado a la formaciónde dichos caracteres, desde el nivel de posiciones de un cod ón hasta la organización y estructura genómica y anatómica de un organismo , en un marco de biología comparadaen contextos tanto de poblaciones (microevoluci ón) como de linajes. Para ello require de la hipótesis evolutiva de relaciones entre entidades revelada por una filogenia

Refs: Huelsenbeck, J.P., Rannala, B., 1997. Phylogenetic methods come of age: testing hypotheses in an evolutionary context.

Science 276, 227-232.Huelsenbeck, J.P., Ronquist, F., Nielsen, R., Bollback, J.P., 2001. Bayesian inference of phylogeny and its impact on

evolutionary biology. Science 294, 2310-2314

¿Porqué estudiar filogenética y evolución molecular?

Corolario I:

“Nothing in biology makes sense except in the light of evolution ”- Theodosius Dobzhanski, 1973

(The American Biology Teacher 35:125)

Corolario II:

“Nothing in evolutionary biology makes sense except in the light of a phylogeny”- Jeff Palmer, Douglas Soltis, Mark Chase, 2004

(American J. Botany 91: 1437-1445)

El concepto de filogenia y homología: definiciones básicas

“The stream of heredity makes phylogeny; in a sense, it is phylogeny. Complete genetic analysis would provide the most priceless data for themapping of this stream”. G.G. Simpson (1945)

filogenia

macro-escala micro-escala

Filogenia: historia evolutiva del flujo hereditario a distintos niveles evolutivos/temporales, desdela geneaología de genes en poblaciones (micro-escala; dominio de la genéticade poblaciones) hasta el árbol universal (macro-escala)

espe

cie

1es

peci

e2

espe

cie

3es

peci

e4

espe

cie

4

El concepto de filogenia y homología: definiciones básicas

El proceso evolutivo con sus eventos de especiación ha involucradola sucesiva ramificacióny algunas anastomosis de los linajes hereditarios. Los organismos actuales son el productode esta historia y repesetan la puntas o nodos terminales del árbol de la vida.

El entendimiento completo de una filogenia requieredel conocimiento del patrón u órdende ramificación (cladogénesis) y longitudes de cada rama (cambios anagenéticos dentrode los linajes a lo largo del tiempo).

Eventos de transferencia horizontal de DNA entre ramas del árbol (evolución reticulada) son el resultado de hibridaciones interespecíficas mediadas por diversos mecanismos. El producto de la hibridación puederesultar en genomas 100% híbridos (eucariontes) osólo afectar a determinados loci (mosaicos genómicos de los procariontes).

BGA1FN13r1RC

BC-P14f1Blup MR1f1USDA6T AF169582USDA110 KazusaUSDA122

BC.C1BTA1BC.P5

BC-C2R1BC.MAM1

LMG18230TBC.WK1BC-MK6f1

TAL760ctg1B071TLTMR28cns1

Rhodo palustrisM. huakuii Kazusa

100

88

99

99

70

97

99

89 84

89

62

86

0.02

16

8

2y6

5

28

20y32y33y2755

9

25

3

13

7y101

11y27y31

Page 7: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 7

Homología: es la relación entre dos caracteres que han descendido, generalmente con modificación, de un ancestro común. Estrictamente se refierea ancestríacomún inferida.

Analogía: es la relación existente entredos caracteres cuando éstos, aún siendo similares,han descendido convergentemente a partir de caracteres ancestrales norelacionados en t érminos genealógicos.

Cenancestro: del inglés (cenancestor), es el ancestro común más recientede los taxa bajoconsideración.

El concepto de filogenia y homología: definiciones básicas El concepto de homología: definiciones básicas

Dado que filogenia es “el flujo de la herencia” , sólo los caracteres genéticos o heredablesson informativos desde una perspectiva genealógica .

Caracteres y estados de caracter . Los evolucionistas distinguen entrecaracteres, comopor ejemplo los amino ácidos, y sus estados de caracter, como pueden ser gly o trp.La homología reside en los caracteres , no en sus estados !!!

El reconocimiento de la condición de homología entre caracteres . La homología no es unacualidad cuantitativa. Sólo hay dos condiciones posibles: ser o no homólogo. No se es más o menos homólogo. Es como el embarazo. Se está o no se está en dicho estado.

Por tanto, para cuantificar el parecido entreun par de secuencias homólogasse dice que presentan globalmente un 70% y 95% de identidad y similitud, respectivamente.(no existe algo como 95% de homolog ía).

El concepto de homología es simplemente una abstracción sobre la relación entrecaracteres, sobre su ascendencia común, relación que es indispensable determinarpara poder hacer reconstrucciones filogenéticas que reflejen la historia del “flujo de la herencia”.

El concepto de homología: definiciones básicasSubtipos de homología: ortología, paralogía y xenología

Evento de especiación #1

Evento de duplicaci ón #1

ortología: relación entresecuencias en la que la divergencia acontece tras un evento deespeciación. El ancestro común es el cenancestro. La filogenia recuperada deestas secuencias refleja la filogenia de las especies.

paralogía: condición evolutiva en la que la divergencia observada acontece tras un evento de duplicación génica. La mezcla de ortólogos y parálogos en un mismo análisisfilogenético recupera la filogenia correcta de los genes pero no necesariamentela de los organismos o taxa.

xenología: relación entre secuencias dada por un evento de transferencia horizontal entrelinajes. Distorsiona fuertementela filogenia de las especies.

“flu

johe

redi

tari

o”a

lo la

rgo

del t

iem

po

cenancestro

Subtipos de homología: ortología, paralogía y xenología

Evento de especiación #1

Evento de duplicaci ón #1

“flu

johe

redi

tari

o”a

lo la

rgo

del t

iem

po

cenancestro

La naturalezadel subtipo de relación de homolog ía entre nodos terminales depende sólo de sila secuencia cenancestral está localizada en un punto que correspondea un evento de espe-ciación ( “Y invertida”) o de duplicación (línea horizontal).

Cuandosea posible, hay que usar estos subtipos para definir la relación de homología

A, B y C corresponden a tres poblaciones (especies). Existen 2 eventos de especiación (Sp) y dos de duplicaci ón (D p). Dos genes cuya sec. cenancestral está en un nodo correspondiente auna Y invertida son ortólogas. Si dicha sec. correspondea un evento de duplicaci ón, son pará-logas. Así C2 y C3 son parálogas entre ellas pero orólogas con respecto a B2. Ambas son parálogas respecto a B1, pero ortólogas respecto a A1. La flecha roja denota un evento de transferencia horizontal entrelas especies A y B. El gen AB es xenólogo con respecto a los otros 6 genes.

Page 8: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 8

Marcadores moleculares usados en filogenética y evolución molecular

Polimorfimos de DNA y proteínas

I) Marcadores dominantes (? secuencias)- RFLPs- Fingerprints genómicos (AFLPs, RAPDs, Rep-PCR, SINEs

SSCPs, NSNPs ...)- Análisis multilocus de isoenzimas- etc ...

Los datos moleculares revelan información genética. Sólo caracteres con una base genéticason de inter és en filogenética y evolución. De ahí que los marcadores moleculares son gene-ralmente los favorecidos para hacer inferencias filogenéticas y evolutivas a distintos nivelestaxonómicos.

Los caracteres fenotípicos muchas veces tienen una base genética menos clara y estángobernados por las interacciones de muchos genes con el ambiente. Muchos fenotipospresentan gran plasticidad , es decir, que un mismo genotipo puede presentar una gradaciónde fenotipos. Esta variación fenotípica puede confundir las verdaderas relaciones filo-genéticas y determinación de parentescos.

El uso de protocolos de PCR permite acceder a todo el mundo biológico para escrutiniosgenéticos , incluyendo a las comunidades de microorganismos no cultivables

Los métodos moleculares permiten una fácil y robusta distinción entrehomología y analog íay permiten hacer comparaciones de divergencia evolutiva usando métricos universales

II) Secuencias moleculares DNA/proteína

• Secuencias de DNA representan el “nivel anatómico” más fino de un organismo

• La premisa fundamental en evol. molec. es que en las secuencias de DNA y de susproductos se encuentra escrita una buena parte de su historia evolutiva.

Objeticos importantes del curso son:1.- mostrar qué información evolutiva es la que se encuentra escrita en las secuencias

de DNA y prot. 2.- proporcionar una base t eórica y práctica sobre los métodos para recuperarla

Marcadores moleculares usados en filogenética y evolución molecular

• Buena parte de la biología moderna tiene por objetivo revelar la información contenida en secuencias moleculares.

Protocolo básico para un análisis filogenético de secuencias moleculares

Interpretación evolutiva y aplicación de las filogenias

Colección de secuencias homólogas

• BLAST y FASTA

Alineamiento múltiple de secuencias

• Clustal, T-Coffee ...

Estima filogenética

• NJ, ME, MP, ML, Bayes ...

Análisis evolutivo del alineamiento y selección del modelo de sustitución más ajustado

• homogeneidad composiconal, saturac.• selección de modelos, ...

Pruebas de confiabilidad de la topolog ía inferida

• proporciones de bootstrap probabilidad posterior ...

Selección de marcadores adecuados para hacer inferencias evolutivasa distintos niveles de profundidad filogenética

Restricciones funcionales vs. tasas de sustitución:

• Existe gran variabilidad en la tasa de sustitución entre genes y dominios génicos :

- intrones vs. exones- regiones codificadoras vs. regiones intergénicas o pseudogenes- residuos catalíticos vs. no catalíticos, dominios estructurales vs. no estructurales- 3as. posiciones vs. 1as y 2as en codones de secuencias codificadoras,- asas vs. orquillas en rRNAs y tRNAs ...

• Tasas de evolución y la teoría neutral de evolución molecular:

el reloj molecular, calibración y datación de eventos de especiación/extinción de linajes y de pandemias ...

• Existen genes de evolución muy rápida o muy lenta:-fibrinopéptidos evolucionan una tasa x900 > a la de ubiquitina y x20 > citocromo C-genes de HIV evolucionan a x106 veces la tasa de un gen humano promedio!

Page 9: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 9

• Distintas proteínas presenta diferentes tasas de sustitución. As í los fibrinopéptidos presen-tan relativamentepocas constricciones , presentando una elevadatasa de sustitución neutral. Citocromo C, en cambio, presenta mayores constricciones evolutivas y presenta una tasa de sustitución menor. La hipótesis del reloj molecular dice que esta tasa, para ciertas proteínas , es constante en dis tintos linajes. (de Hartl y Clark, 1997. Principles of Population Genetics, Sinauer)

tasas de evolución de tres proteínasen sustituciones/sitio/MY

“Mira retrospectiva en el tiempo”

• fibrinopéptidos : 50- 200 MY• hemoglobinas: 200- 800 MY• citocromo C: 400-1300 MY

1as rocas Sedimentariasenriquecidas en 1 2C Issua (Groenlandia)3.8 Byr (5 am)

1os microf ósilesWarrawoona,Australia

3.4 Myr (7 am)

1os estromatolitosCianobacteriasFotosíntesis oxig énicaWarrawoona,Australia

2.8-3 Byr (9 am)

1os eucariontesFormaciones deFe bandeadoGuntflint , OntarioCanada

2. 0. Byr (2 pm)

Ediacara,Explosión cámbricaFósiles de variosPhyla animales

0.75. Byr (8 pm)

Extinci ón dinosaurios65 Myr(20 min )

4.6 4.0 3.0 2.0 1.0 0.0 1x10 9 años(Byr)

atmósfera reductora atmósfera oxidante

Hadésico Arqueozóico Proterozóico Fanerozóico

Historia de la tierra y de la vida

Evolución precelular(agragados supramacromoleculares)

20 %

0%(% O2 atmosférico)

Evolución orgánica en tiempo evolutivo- La dimensión temporal

Vida exclusivamente procariótica por al menos 1.5 Byr!

• Homo erectus(Kenya)

1.6 Myr (29.5 seg)• H. sapiens(Dali Fosil, China)

209 kya; 3.9 segundos

http

://e

n.w

ikip

edia

.org

/wik

i/Li

st_o

f_hu

man

_evo

luti

on_f

ossi

ls00

0

Precámbrico (reducción progresiva de temperatura, de 70 – 20ºC)

Biología“clásica”

- Elucidación del árbol universal, sistemática bacteriana y la identificación/clasificaciónde microorganismos ambientales (cultivables y NO CULTIVABLES > 90-99%)

rrs : un marcador lento

Bacteria: peptidoglicano; lípidos de membrana son ésteres de glicerol ; RNA pol . 4 subunidades; formilmetionina como aa de inicio ...

Archaea: pseudo peptidoglicano; lípidos de membrana son éteres de glicerol ; RNA pol . =8 subunidades; metionina como aa de inicio ...

Procariontes: carecen de núcleo y orgá nulos

Eucariontes: células núcleadas y con orgánulos

Aplicaciones y predicciones filogenéticas (I)

ActinobacteriaCyanobacteria

CaenoharbditisDrosophilaDanioGallus

HomoRatus

Firmicutes

Proteobacteria

γ

β

α

• Genomic Tree of life(ML JTT+G, 100 boot)based on 31 orthologsfrom 191 species with sequenced genomes

Ciccarelli et al. 2006 Science 311:1283-87 – Toward automatic reconstruction of a highly resolved tree of life

Page 10: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 10

64.873.3

54.6 55.7

39.1 39.1• El estudio de Gaucher et al. se basa en la resurrección de proteínas EF-Tu de nodossucesivamente más profundos en la filogenia universal, hasta llegar a LUCA

• EF-Tu es el factor de elongación no-termo-estable, de distribución universal, y que pre-senta una correlación muy fuerte (0.91) entresu temp. de desnat. y la temp. Ambiental a laque viven los organismos de los que se han ais-lado

• Las proteínas resurrectas de los nodos másprofundos presentan temps. de desnat. muysuperiores a los de nodos más recientes.

• Esta evidencia molecular correlaciona muy bien con la evidencia geoqu ímica derivada del análisis de relaciones de is ótopos de 18O y 30Si de rocas sedimentarias del Precámbrico

(3,800-542 millones de años atrás) que sugieren un enfriamiento progresivo de unos 70ºChace 3,5 Billones de años a tan s ólo 20ºC hace 800 Millones de años.

Scans de Dicroísmo circular representativos de Proteínas EF-Tu actuales y ancestrales, correspondientesa proteínas mesófilas (a,c) e hipertermófilas (b,d). a) E. coli; b) Thermus; c,d) proteínas ancestrales tempranas y derivadas

Eric Gaucher et al. 2008

Filogenia universalbasada en secuencias rrs

(Woese et al., 1991)

La TGH y la filogenia universal –problemas y limitaciones evidenciadas desde la perspectiva genómica

Problemas e incógnitas de las filogenias profundas:

• ¿ Cuantos ortólogos son realmente universales?• Distinción entre ortólogos, parálogos y xenólogos• ¿Cuanta señal filogenética queda en las secuencias?• ¿Alineamientos confiables?• Métodos de reconstrucción y artefactos• Congruencia de señales filogenéticas provinientes

de distintos genes• ¿Existió realment un sólo ancestro?• ... una larga lista

Filogenia genómica – ¿árbol o red?

Doolittle, 1999

mitocond

riascloro

plastos

Doolittle, 1999

El origen evolutivo de los organelos: un caso clásico de TGH

Se comparan las estructuras genómicas de tres cepas de Escherichia coli

E. coli uropathogénica CFT073E. coli enterohemorrágica EDL933

E. coli comensal K12

TGH y demarcación de especies bacterianas- una perspectiva de genómica comparada

Page 11: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 11

Sólo el 39.2% del setno redundante de proteínasde las tres cepas es compartidoentre ellas !!!

tomadode Welch et al. 2002

Islands and evidences for their horizontal transfer

-85% (52 out of 61) of island codons have a significantly different codon usage vs. backbone

-EDL and CFTshare only 10% of island genes, but >98% identity among backbone encoded proteins in the 3-strain comparison

-CFT and EDL strains conatin 60 and 57 islands >4 kb, most of them at the same relativepositions with respec to backbone markers, although island contents are unrelated

- 12 CFT073 and 10 EDL933 islands are closely associated to tRNAgenes

tomadode Welch et al. 2002

Corolario:A la luz de estos resultados queda evidenciado que ha de ejercerse un gran

cuidado a la hora de seleccionar genes para la reconstrucción de filogenias de

especies bacterias.

Loci sinténicos

ortólogos:

Ø filogenia de especies

Ø genética de poblaciones

Loci accesorios:

Ø especialización ecológica

Ø frecuentemente cepa-específicos

0 . 1

B. canariense BC-C2 (Canary Is.)B. canariense BRE-4 (Canary Is.)B. canariense BC-MAM1 (Morocco)B. canariense BC-MAM5 (Morocco), ISLU16 (Spain)B. canariense BC-MAM2, BC-MAM6 (Morocco)

1.00/100

B. canariense BC-MAM9 (Morocco)B. canariense BC- MAM12 (Morocco)1.00/97

B. canariense BC-P22 (Canary Is.)0.99/100

1.00/78

B. canariense BC- MAM8 (Morocco)B. canariense BES-1 (Canary Is.)B. canariense BES-2 (Canary Is.), BC-MAM11 (Morocco)1.00/100

1.00/100

B. japonicum X6-9 (China)

B. japonicum DSMZ30131T (Japan)

1.00/100

B. japonicum FN13 (Mexico)B. japonicum BGA-1 (Canary Is.)B. japonicum BC-P14 (Canary Is.)B. japonicum X3-1 (China)

B. japonicum Blup-MR1 (Germany)

1.00/95

B. japonicum USDA110 (USA)B. japonicum USDA122 (USA), Nep1 (Nepal)1.00/99

1.00/98

0.99/78

Bradyrhizobium genosp . a BC-C1 (Canary Is.) †

Bradyrhizobium genosp . a CIAT3101 (Colombia) †0.99/94

1.00/84

B. liaoningense Spr3-7 (China)B. liaoningense LMG18230T (China)1.00

/100

0.98

Bradyrhizobium genosp . ß BC-P6 (Canary Is.)Bradyrhizobium genosp . ß BRE-1 (Canary Is.)

0.93/86

Bradyrhizobium genosp . ß BC-MK6 (Morocco)

1.00/100

B. yuanmingense B070T (China)B. yuanmingense LMTR28 (Peru)

1.00/93

B. yuanmingense TAL760 (Mexico)

1.00/100

1.00/100

B. elkanii USDA46 (USA)B. elkanii USDA76T (USA)

1.00/100

B. elkanii USDA94 (USA)1.00/100

0.99/91

Bradyrhizobium sp. BTAi1 (USA)Bradyrhizobium sp. IRBG231 (Philippines)†

Bradyrhizobium sp. IRBG127 (Philippines)†

1.00/100

1.00/100

S. meliloti 1021 †

Rho. palustris Pal-1†

*

*

substitutions per site

II

III, α

IV

V, β

VI (B. yuanmingense)

VII (B. elkanii)

VIII (photosynthetic)

I

A. Filogenia Bayesiana de especies de Bradyrhizobium basada en ortólogosglnII+recA congruentes

B. j

apon

icum

B. c

anar

iens

e

• Inferencias basadas en xenólogos tampocorecuperan la filogenia de especies

Vinu

esa

et a

l. (2

005)

. Mol

. Phy

loge

net.

Evo

l. 34

:29

-54

B. nodC ML phylogeny (GTR+G)Al comparar figs. A y B se compruebaque el locus simbiótico nodC hasufrido TGH

bv. g

enis

tear

um

B. japonicum USDA142 B. japonicum USDA136 B. japonicum USDA122B. japonicum USDA110B. japonicum DSMZ30131B. japonicum USDA6TB. elkanii USDA61 D28964.1

B. elkanii USDA94 D28965.1

B. elkanii USDA46 D28963.1

B. canariense BTA1T AJ560653.1

B. canariense BCO 1 AJ560656.1

B. japonicum WM9 AF222753

B. japonicum ISLU256 AJ560651.1

B. japonicum ISLU207 AJ560652.1

B. canariense BLUH1 AJ560655.1S. meliloti 1021 E006469

R. leguminosarum bv. viciae USDA2478 D28960.1

R. leguminosarum bv. trifolii USDA2161 D28959.1

R. leguminosarum bv. trifolii AF217271.1

0.1 substitutions/site

100

100

97

99

100100

100

100

100

79

bv. g

lyci

near

um

B. japonicum

Vinuesa et al. (2005).IJSEM 55:569-575

Page 12: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 12

El pangenoma microbiano: pangenomas abiertos y cerrados

Estima de tamaños del genoma “núcleo” (core) y pangenoma de Rhizobiaceae simbióticos (Vinuesa y Contreras-Moreira, 2007, unpubl.)

Aplicaciones y predicciones filogenéticas (II):Evidencia molecular de transmisión de HIV-1 en un caso criminal usandogenes de evol. r ápida

Un gastroenterólogo fue acusadodel intentode asesinato en 2° gradode su novia medianteinyección de sangrecontaminada con HIV-1.

Este estudio representa el primer caso en el quereconstrucciones filogenéticas de secuencias(paciente P, víctima V y controles LA de portadores en la población) fueron admitidas en una corte criminal en EUA.

Las filogenias de RT y de env mostraron que lassecuencias de la V compartían ancestría directa en forma de paralogía con las de una P del gastroenterólogo.

Análisis de posiciones de codones de la RT de la V revelaron genotipos consistentes con mutaciones que confieren AZTR, similares a las presentadas en la P.

El establecimiento a priori de la P y V comoposiblepar de transmisión del HIV-1 representó una clara hipótesis para ser evaluada en marcos de estadísticafilogenética.

Filogenias del gen RT basadas en secuencias dela V, la P y LA, obtenidas por dos labs. independientes.a) Baylor College of Medicine, Houston, TX (BMC)b) Dpt. Ecology and Evol. Biol., Univ. Michigan (MIC)

Ref: Metzker et al. 2002. PNAS 99:14292-142976

Arboles filogenéticos: una introducción al bosque(I) terminología y conceptos básicos: anatomía de un árbol

• Definición: Un árbol filogenético es una estructura matemática usada para representar la historiaevolutiva (relaciones de ancestro-descendiente) entreun grupo de secuencias o organismos.Dicho patrón de relaciones históricas es la estima hecha de la filogenia o árbol evolutivo.

• reconstrucción de caracteres ancestrales• longitud de ramas• soportede, o confianza en biparticiones

Humano

Chimpancé

Gorila

Orangutanárbol no enraizado, sin direccionalidad

A B C D E

split (bipartición)(ABC|DE = ***--)

nodo terminal, hoja u OTU, grado 1

nodo interno, vértice, grado 3

nodo raíz, grado 2

rama

• Anatomía básica de un árbol

árbol enraizado, con direccionalidad , queindica relaciones ancestro-descendiente(((humano, chimp),gorila), orang)

tiem

po

Arboles filogenéticos: una introducción al bosque(II) enraizamiento de árboles

• La mayoría de los mé todos de reconstrucción estimanárboles no enraizados, por lo que no disciernen entrelas 5 posibles topologías enraizadas generables a partirde 4 OTUs.

• Para enraizar un árbol (decidir cual topología es laque refleja el proceso evolutivo ), necesitamos infor-mación biológica adicional

Tres métodos usados para el enraizado deárboles:a) grupo externo - (invertebado) a grupo

interno (vertebrados)b) punto medio – se pone la raíz en el punto

intermedio del camino más largo del árbolc) duplicación génica – enraizamos en el nodo

que separa a las copias parálogas

Page 13: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 13

Arboles filogenéticos: una introducción al bosque(III) terminología y conceptos básicos

ABCDE

• Los árboles son como móviles : las ramas pueden rotarse sobre sí mismas sin afectara las relaciones entre los OTUs; ((((A,B),C),D),E) se puederepresentar como:

CABDE

=ECABD

=

• Los árboles presentan distintos grados de resoluci ón (árboles consenso)

politomías

topología estrella topología parcialmenteresuelta

topología totalmenteresuelta

Arboles filogenéticos: una introducción al bosque(IV) terminología y conceptos básicos: tipos de politomías

• Existen distintos tipos de politomías

politomía duradivergencia simultánea

politomía blanda(incertidumbre)

?

ó ó ...

Arboles filogenéticos: una introducción al bosque(V) terminología y conceptos básicos: tipos de árboles

• Un cladograma : sólo indica las relacionesde ancestría enter OTUs

R. galegaeR. huautlenseS. melilotiM. plurifariumB. japonicum

sin

sign

ific

ado

sin significado

• Una topolog ía aditiva contiene la informa-ción sobre longitudes de ramas , que reflejala distancia genética entre OTUs. As í entreR. galegae y R. huautlense la distancia esti-mada es de: 0.05 + 0.06 = 0.11

R. galegaeR. huautlense

S. melilotiM. plurifarium

B. japonicum

0.05

0.060.070.090.10

0.02

0.010.02

0.02 Sust./ sitiosin

sign

ific

ado

divergenciagenética

• Una topolog ía ultramétrica, dendrograma oárbol linearizado, representa un tipo espe-cial de árbol aditivo en el que los nodos ter-minales son todos equidistantes de la raíz.Este tipo de árbol se emplea para represen-tar el tiempo evolutivo, expresadobien comoaños o cantidad de divergencia medida porun reloj molecular

R. galegaeR. huautlenseS. melilotiM. plurifariumB. japonicum

0.000.020.040.060.080.10

0100200300400 My

Sust./sitio/My

sin

sign

ific

ado

tiempo

plesiomorfía: caract. ancestral; estado plesiomórfico o ancestralapomorfía : caracter derivado; estado apomórfico

Arboles filogenéticos: una introducción al bosque(VI) terminología y conceptos básicos

• Terminología relacionada con la reconstrucción de la historia de cambios enestados de caracter

autapomorfía sinapomorfía

• carácer derivadoúnico (aut)

• carácer derivadocompartido (syn)

homoplasia

• carácer compartido nohomólogo, es decir , noheredado directamentedel ancestro

Page 14: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 14

evoluciónparalela

Arboles filogenéticos: una introducción al bosque(VII) terminología y conceptos básicos

• Tipos de homoplasia

Evolución independientedelmismo estado de caracter apartir de la misma condiciónancestral

evoluciónconvergente

Evolución independientedelmismo estado de caracter apartir de una condiciónancestral diferente

pérdidasecundaria

Reversión a la condiciónancestral

Arboles filogenéticos: una introducción al bosque(VIII) terminología y conceptos básicos

• Filogenia y clasificación de organismos: monofilia, parafilia y polifilia

grupos monofil éticos o clados

grupos no monofiléticos

aves

coco

drilo

slag

artos

tortu

gas

Parafilia

“reptiles”

• Grupos parafiléticos agrupana organismos que compartencaracteres primitivos (plesio-mórficos), excluyendo a otrosdel mismo linaje que presentancaracteres derivados (autapo-mórficos)

buitr

esnue

vomu

ndo

cigü e

ñas

aves

de p

resa

buitr

esvie

jomu

ndo

Polifilia

“buitres”

• Grupos polifiléticos agrupana organismos que compartencaracteres convergentes(homoplásicos) pertenecientesa distintos linajes

Arboles de genes vs. árboles de especies -el problema de la definici ón de relaciones de homología

Relaciones de homología entre genes:

Xenología – la homología se debe a un evento de transferencia lateral desde otro linaje

Ortología – genes presentes en distintos taxa que comparten un ancestro común no duplicado,y que han sido heredados verticalmente

Paralogía – genes presentes en distintos taxa o en un mismo genoma resultantes de al menosuna duplicación génica y no de un proceso de especiación

• La filogenia de especies puede ser inferidaerróneamente cuando se reconstruye en basea secuencias parálogas y no se muestrean todaslas copias (p. ej. si muestreamos sólo las copias1, 3 y 5) eq ((fugu,human), mouse) !!!

• Más compleja aún es la estima de la filogenia deespecies si ha habido pérdida diferencial deparálogos en los dintos linajes a comparar

• Por tanto la inferencia de una filogenia de especiesse realizará preferentemente usando genes de copiaúnica, lo que hace más probable la condición deortología

Homología entre genes: la evolución de lisozimas, un ejemplo cl ásico de evolución paralela

• Todas las lisozimas son homólogas al tener un ancestro común

• Las copias en el langur y la vaca son ortólogas al descenderde la misma copia (alelo) ancestral de lisozima

• La historia evolutiva (filogenia) de las lisozimas convencio -nales y las que ligan Ca2+ se remonta a distintas copias de lalisozima ancestral, y por tanto son familias parálogas

• La funcionalidad de las lisozimas que ligan Ca2+ del caballo yde la paloma es homóloga dado que la funcionalidad ancestralde estas proteínas era ligar Ca2+

• Dado que las funciones digestiva de lisozimas en rumiantesvs. el ave hoatzin han surgido independientemente en cadauno de estos grupos, esta funcionalidad no es homóloga,tratándose de un evento de evolución paralela convergente

Al hablar de homología debemos distinguir además entre homolog ía entre genes, secuencias y funciones

Arboles de genes vs. árboles de especies -el problema de la definici ón de relaciones de homología

Page 15: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 15

Inferencia Filogenética –introducción

• La inferencia de relaciones filogenéticas a partir de secs. moleculares requiere de laselección de uno de los muchos métodos disponibles

• Objetivos fundamentales de este curso son:

1. desarrollar un marco conceptual para entender los fundamentos teóricos quedistinguen a los distintos métodos de inferencia (clasificación de métodos)

2. presentar el uso de modelos y suposiciones en filogenética

3. manejo empírico de diversos paquetes de software para inferencia filogenética bajodiversos criterios

• Con frecuencia la inferencia filogenética es considerada como una “caja negra” en la que“entran las secuencias y salen los árboles”

R. galegaeR. huautlense

S. melilotiM. plurifarium

B. japonicum

0.05

0.060.070.090.10

0.02

0.010.02

0.02 Sust./ sitio

?

Métodos de reconstrucción filogenética – introducción

• La inferencia de una filogenia es un proceso de estimación; se trata de obtener la mejorestima posible de una historia evolutiva basada en la información incompleta y con frecuen-cia ruidosa contenida en los datos. Estos, por lo general, son moléculas y especies contem-poráneas

• Los métodos de inferencia filogenética están diseñados para este fin siguiendo una de dosestrategias computacionales :

1. mediante la definici ón de un algoritmo que determina los pasos a seguir para lareconstrucción de la topología

2. mediante la definición de un criterio de optimización mediante el cual poderdecidir cual(es) topología(s) son las mejores (o igualmentefavorecidas)

• En principio, sería posible postular escenarios evolutivos ad hoc mediante los cualescualquier filogenia tomada al azar podría haber producido los datos observados ;es esencial por ello contar con un criterio estadísticamente y biológicamenterigurosopara la selección de una o más topologías de entretodas las posibles

• Los métodos algorítmicos tratan a los datos de diferente manera que los basados en criterios de optimización: análisis de distancias vs. caracteres discretos

Métodos de reconstrucción filogenética: algoritmos vs. criterios de optimización

• Los métodos algorítmicos combinan la inferencia del árbol y la definición del mejor árbolen una misma operación. Son por ello muy rápidos

• Aquellos basados en criterios de optimización (CO) tienen en cambio dos pasos lógicos.

1. definir el criterio de optimización (descrito formalmente en una función objetiva)para evaluar cada posible topología, asignándole una puntuación con la que podercomparar cuantitativamente el mérito de cada árbol en base al criterio de opti-mización

2. en un segundo paso se usan algoritmos de búsqueda específicos para calcular elvalor de la función de objetividad y para encontrar el/los árbol(es) con la mejorpuntuación acordea estecriterio (un valor máximo o mínimo, según el caso)

• Los métodos basados en CO desacoplan por lo tanto los supuestos evolutivos hechos en elprimer paso de las t écnicas computacionales del segundo. El precio de esta claridad lógicaes que estos métodos son muchísimo más lentos que los algorítmicos, debido a que tienenque hacer búsquedas en el inmenso espacio de topologías para encontrar la(s) mejor(es)topologías

Inferencia filogenética molecular –clasificacón de métodos

• Podemos clasificar a los métodos de reconstrucción filogenética en base al tipo d e

datos que emplean (caracteres discretos vs. distancias ) y s i usan un método algorítmico

o un método de búsqueda basado en un criterio de optimización para encontrar

la topología óptima bajo el criterio seleccionado

UPGMAy

Neighborjoining

Mínimoscuadrados

yEvolución

mínima

Máximaparsimonia

yMáxima

verosimilitud

Tipo de datos

distanciascaracteresdiscretos

Mét

odo

de r

econ

stru

cció

n

criter

iode

op

timizac

ión

algo

ritm

ode

agru

pamient

o

Page 16: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 16

Métodos de reconstrucción filogenética – una clasificación

I.- Tipos de datos: distancias vs. caracteres discretos

• Los métodos de distanciaprimero convierten los alineamientos de secuencias en unamatriz de distancias genéticas en base al modelo evolutivo seleccionado, la cual es usadapor el método algorítmico de reconstrucción para recuperar el árbol (UPGMA y NJ)

• Los métodos discretos (MP, ML, Bayesianos) consideran cada sitio del alineamiento(o una función probabilística para cada sitio) directamente

• Un set de 4 secs. y la matriz de distanciascorrespondiente

• Un árbol de parsimonia y uno de distanciaspara este set de datos produce topolo-gías y longitudes de ramas idénticas

• La diferencia radica en que el árbol de parsimonia identifica qué sitio del alinea-miento contribuye cada paso mutacional enla longitud de cada rama

Métodos de reconstrucción filogenética – una clasificación

II. Métodos algor ítmicos vs. criterios de optimización

• Los métodos algorítmicos o de agrupamiento (clustering) siguen una serie dada de pasoso reglas computacionales previamente definidas (algoritmo) para reconstruir el árbol. Los métodos más usados son el UPGMA y NJ, basados todos en una matriz de distancias

• Estos métodos son muy rápidos, pero sensibles a parámetros tales como el orden en que sevan añadiendo OTUs al árbol creciente

• Al no seguir un criterio de optimización, no se puede evaluar la bondad relativa de ajustede topologías alternas a un set de datos particular

Métodos de reconstrucción filogenética – una clasificación

II. Métodos algor ítmicos vs. criterios de optimización

• Los métodos de reconstrucci ón de MP y ML utilizan diferentes criterios de optimización para seleccionar el/los árbol(es) entre las topolog ías que han de evaluar

• A cada topología se le asigna una puntuación (score) que es funci ón del ajuste existenteentre la topolog ía y los datos

• Los métodos de optimización tienen la gran ventaja de requerir una función probabilísticaexplícita que relaciona los datos con la topolog ía (p. ej. un modelo de sustitución). Ello permite evaluar la calidad de cualquier árbol (topología), permitiendo el uso de distintas técnicas estadísticas para evaluar la significancia con la que las distintas hipótesis evolutivas (topologías) en competición se ajustan a los datos!!!

• La gran limitación de los métodos de optimización radica en que son computacionalmentemuy costosos, requiriendo por lo general implementaciones heur ísticas del algoritmo

• Criterios de optimización: reglas para decidir entre pares de topolog ías cual es mejor(dados los datos)

• Ejemplos de métodos de búsqueda de árboles por criterio de optimización son:SCORE

- MP: máxima parsimonia (menor es mejor)- ML: máxima verosimilitud (mayor es mejor)- ME: evolución mínima (menor es mejor)- LS: cuadrados mínimos (menor es mejor)

III.- Criterios de optimización y el problema del número astronómico de topolog ías

El número de topologías posibles incrementa exponencialmente con cada nuevo taxono secuencia (S ) que se añade al análisis

No. de árboles no enraizados= (2s-5)!/2s-3(s-3)

No. de árboles enraizados= (2s-3)!/2s-2(s-2)

Taxa árboles no enraiz. Árb. Enraiz.4 3 158 10,395 135,13510 2,027,025 34,459,42522 3x1023 ...50 3x1074 * ...

* Esto son aprox. 10,000 x el no. de átomos en el universo!!!

Métodos de inferencia filogenética: en busca de la topología óptima

Por tanto se requieren de estrategias heurísticas de búsqueda árboles cuando n > ~12para poder implementar métodos basados en criterios de optimización

Page 17: Historia Biologia Evolutiva

Tema 1: Conceptos básicos de evolución molecular y filogenética

Genómica Evolutiva I, Licenciatura de Ciencias Genómicas - UNAM, México. Semestre 2009-1

© Pablo Vinuesa 2008, [email protected]; http://www.ccg.unam.mx/~vinuesa/index.html 17

• El método de parsimonia (Pars) considera cada sitio filogenéticamente informativo (Pi) el alineamiento (al menos 2 pares de secuencias que compartan un polimorfismo). Los sitios constantes (C) y los singletones (S) no son considerados.

IV. Parsimonia: dados dos árboles, se prefiere el que requiere menos cambios en estados de caracter

reconstruccionespara el sitio 2

Pi C S

Pi= Pars. inform.C= ConstantS= Singleton

Clases de sitios:2k

L = S lii=1

• El supuesto teórico (modelo de evolución) impl ícito al método es que el árbol más verosímiles aquel que requiere el mínimo n úmero de sustituciones para explicar los datos (alinea-Miento). El criterio de optimizaci ón de la Pars es el de cambio o evoluci ón mínima.

• Para cada sitio del alineamiento el objetivo es reconstruir su evolución bajo la constricciónde invocar el número m ínimo de pasos evolutivos. El número total de cambios evolutivos sobre un árbol (longitud en pasos evolutivos del árbol) es simplemente la suma de cambios de estados de caracter (p. ej. sustituciones) en cada sitio Pi de la matriz o alineamiento

Criterios de optimización

El método de máxima verosimilitud (ML) considera cada sitio variable del alineamiento(incluídos singletones). Bajo el criterio de ML se busca la topología que hace más verosímilel patrón de sustituciones de un alineamiento dado un modelo evolutivo explícito!

Así, para un set de datos D y una hipótesis evolutiva (topología) H, la verosimilitud de dichosdatos viene dado por la expresión:

LD=Pr(D|H) que es la probabilidad de obtener D dada H (una probabilidad condicional) !

Por tanto la topología que hace nuestros datos el resultado evolutivo más probable corresponde a la estima de máxima verosimilitud de la filogenia (likelihood scoreó valor de verosimilitud).

Criterios de optimización

V. Máxima verosimilitud: dadas dos topologías, la que hace los datos observadosmás probables ( “menos sorprendentes ”) es la preferida

• la probabilidad está relacionada con la “sorpresividad” de los datos

• Estaríamos sorprendidos de obtener esteresultado, dadasu bajísima probabilidad (1/6)20 ó 1 en 3,656,158, 440,062,976!

• Pero la probabilidad dependedel modelo probabilístico asumido

• En filogenética, las distintas topologías representan a los distintos modelos, y se selecciona aquel modelo que nos hacesorprendernos menos de los datos que hemos coleccionado

• Aproximaciones tradicionales (matrices de distancia, ME, ML, MP)

- la búsqueda tiene por objetivo encontrar la topología óptima (estima puntual)

- no pueden establecer el soporterelativo de las biparticiones a partir de una única búsqueda

MLE

LH= Pr(D|H) = Pr(D|τυφ)LD

tree space (τi )

• Aproximación Bayesiana

- no busca una solo topología óptima sino una población de árboles muestreadosen función de su probabilidad posterior (algoritmosMCMC)

- la muestra de árboles obtenidos en una sola sesión de “búsqueda” es usada para valorarel soporte de cada split en términos de propabilidad posterior

95% credibility

interval

pP

tree space (τi )

Criterios de optimización: la alteranativa Bayesiana