biogeografía histórica y análisis de vicarianza: una perspectiva computacional
Upload: asociacion-argentina-de-bioinformatica-y-biologia-computacional
Post on 07-Jul-2015
5.688 views
TRANSCRIPT
![Page 1: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/1.jpg)
Biogeografía históricay
Análisis de Vicarianza:
Una perspectiva computacional
J. Salvador AriasCONICET, INSUE, Facultad de Ciencias Naturales e Instituto Miguel Lillo, Universidad Nacional de Tucumán, Tucumán
![Page 2: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/2.jpg)
Biogeografía histórica
Distribución geográfica en un contexto filogenético
Brundin, 1972
![Page 3: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/3.jpg)
Biogeografía histórica
Los métodos se basan en una analogía entre la reconstrucción filogenética y la biogeografía.
Optimación de caracteres, bien sea usando parsimonia de Fitch o similares a Sankoff, o mapeo estocástico usando likelihood.
![Page 4: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/4.jpg)
Biogeografía histórica
Áreas predefinidas:Definidas arbitrariamente, nunca se contrastanIgnoran la naturaleza espacial de los datosNo permiten escalas detalladasSolo son viables con pocos “caracteres” (áreas)Susceptibles a problemas que no son propios de la biogeografía (v.g. especies ampliamente distribuídas)
Nylander et al. 2008
![Page 5: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/5.jpg)
Análisis de vicarianza
Ideas propuestas por Peter Hovenkamp (1997, 2001)Uso directo de información geográfica
![Page 6: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/6.jpg)
Análisis de vicarianza
Ideas propuestas por Peter Hovenkamp (1997, 2001)Uso directo de información geográficaEn lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones
![Page 7: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/7.jpg)
Análisis de vicarianza
Ideas propuestas por Peter Hovenkamp (1997, 2001)Uso directo de información geográficaEn lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribucionesDistribución de un nodo es la suma de sus descendientes
![Page 8: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/8.jpg)
Distribuciones
![Page 9: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/9.jpg)
Distribuciones
Puntos georeferenciados
![Page 10: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/10.jpg)
1. Para cada terminal t2. Para todas las celdas (i,j)3. Dt (i,j) ← 0, 4. Para cada registro r en t5. Dt (i,j) ← 1 para la celda (x,y) asignada al registro r6. Para cada Vk de (x,y), Dt (v1,v2) ← 17. Fin-para 28. Fin-para 1 ∎
Relleno de “imagen digital”
![Page 11: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/11.jpg)
Relleno de “imagen digital”
![Page 12: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/12.jpg)
Distribuciones
Rellenado de la distribución
![Page 13: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/13.jpg)
Distribuciones
Grilla de 1x1 grados, entre los 60º N y 60º S: 360 x 120 celdas.
Un poco más de 70 terminales, eso es más de 140 nodos: 360x120x140 celdas.
Más de 6'000.000 de celdas, en su mayor parte vacías!
![Page 14: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/14.jpg)
Quad-árboles
Construir Q (i1, i2, j1, j2, anc)1. Si (D|i1, i2, j1, j2| = 0) retornar NULO2. Q -> ancestro ← anc3. Asignar coordenadas del cuadrante a Q4. Si ((i1 = i2) y (j1=j2))
Q -> esCelda? ← verdaderoretornar Q
5. x ← i1 + ((i2 – i1) / 2), y ← j1 + ((j2 – j1) / 2)Q -> esCelda? ← falso
6. Q -> NW ← Construir Q (i1, x, j1, y, Q)Q -> NE ← Construir Q (x, i2, j1, y, Q)Q -> SW ← Construir Q (i1, x, y, j2, Q)Q -> NW ← Construir Q (x, i2, y, j2, Q)
7. Retornar Q ∎
![Page 15: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/15.jpg)
Quad-árboles
![Page 16: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/16.jpg)
Criterio de optimalidad
![Page 17: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/17.jpg)
Las reconstrucciones posibles se evalúan eliminando nodos, y revisando si dicho eliminación incrementa el número de nodos vicariantes.
El criterio optimo es entonces:
(i) minimizar nodos no vicariantes(ii) minimizar eliminación de nodos
Criterio de optimalidad
![Page 18: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/18.jpg)
Criterio de optimalidad
Sea un nodo-j un nodo en donde todos sus descendientes menos uno tienen una eliminación de distribucion (Page, 1994; Arias et al. 2008).
Cualquier otro node es vicariante o no vicariante.
![Page 19: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/19.jpg)
Sea Cn el costo de la reconstrucción del nodo n, y desc (n) es la lista de descendientes de n.
Cn = ( ∑i = desc(n) Ci ) + Yn + Xn
Criterio de optimalidad
![Page 20: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/20.jpg)
Criterio de optimalidad
Cn = ( ∑i = desc(n) Ci ) + Yn + Xn
Donde Yn
Yn = costo de una eliminación, si la distribución de n es eliminada,
De lo contrario, Yn = 0
![Page 21: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/21.jpg)
Cn = ( ∑i = desc(n) Ci ) + Yn + Xn
y Xn
Xn = 0, si n es un nodo-j,
Xn = 0, si n es un nodo vicariante,
Xn = costo de un nodo no vicariante, si n es no vicariante.
Criterio de optimalidad
![Page 22: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/22.jpg)
Esta operación permite conocer el costo del árbol para una reconstrucción dada.
El peso de la búsqueda esta en la optimación del árbol: cada reconstrucción propuesta, requiere una optimación.
Optimación
![Page 23: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/23.jpg)
Optimar (nodo n)1. Si (n es eliminado)
Cn ← costo_eliminaciónSino
Cn ← 02. Si n es terminal, retornar Cn
3. Para cada i que sea desc(n)Cn ← Cn + Optimar (i)
5. Si n es no vicarianteCn ← Cn + Costo_no_vic
6. Retornar Cn ∎
Optimación ingenua
![Page 24: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/24.jpg)
Optimación ingenua
Requiere visitar todos los nodos del árbol.
Su estructura revela la posibilidad de una optimación más adecuada: el costo de de un nodo depende solo de sus nodos descendientes, por lo tanto, si se parte de una reconstrucción, es posible únicamente optimar los nodos ancestrales al nodo modificado.
![Page 25: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/25.jpg)
Optimar (nodo n)1. Minetras n dif NULL2. Si (n es eliminado)
Cn ← costo_eliminaciónSino
Cn ← 02. Si n es terminal, n ← anc (n), volver a 13. Para cada i que sea desc(n)
Cn ← Cn + Ci
4. Si n es no vicarianteCn ← Cn + Costo_no_vic
5. n ← anc (n)6. Fin-Mientras ∎
Optimación incremental
![Page 26: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/26.jpg)
Optimación incremental
Depende de la estructura del árbol. En el peor caso, revisa todos los nodos del árbol.
En promedio el número de visitas es el número de nodos entre el terminal más alejado de la raíz y la raíz.
![Page 27: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/27.jpg)
Búsquedas heurísticas
Las búsquedas exactas son muy costosas. El problema es una combinatoria, por lo que existen múchisimas posibilidades.
Búsquedas heurísticas no garantizan encontrar el óptimo, pero permiten atacar problemas mucho mayores.
![Page 28: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/28.jpg)
“Subida de colina” simple
1. Min ← Ct
2. Para cada nodo n en el árbol t3. Eliminar n
Optimizar t4. Si (Ct < Min) volver a 1.5. Restaurar n
Optimizar t6. Fin para-2. ∎
![Page 29: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/29.jpg)
“Subida de colina” simple
Rápida, independiente del punto de partida.
En el peor caso revisa todos los nodos, 2n optimiaciones.
Es poco efectiva en árboles grandes, las primeras eliminaciones pueden ser poco óptimas.
![Page 30: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/30.jpg)
Heurística de Page1. Prev ← Ct
2. Min ← Ct
Pos ← NULL3. Para cada nodo n en el árbol t4. Eliminar n, Optimizar t5. Si (Ct < Min)
Min ← Ct
Pos ← n6. Restaurar n, Optimizar t7. Fin para-3.8. Si (Min < Prev)
Eliminar n, Optimizar tvolver a 2. ∎
![Page 31: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/31.jpg)
Más exhaustiva que la subida simple.
En cada eliminación hace dos optimaciones. Un ciclo completo hace 2n optimiaciones.
Si no hay empates, siempre realiza la misma secuencia.
Heurística de Page
![Page 32: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/32.jpg)
Los algoritmos presentados aquí se encuentran implementados en VIP (Vicariance Inference Program), un programa que pronto estará disponible de manera gratuita en internet.
Este es el primer programa de biogeografía que utiliza filogenias y datos geográficos simultáneamente
Implementación
![Page 33: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/33.jpg)
Es difícil que se consigan mejores soluciones para la compresión de datos geográficos o optimaciones más rápidas.
En cambio, hay muchas posibilidades para mejorar las heurísticas: búsquedas limitando los nodos a optimar, muestreos basados en cristalización simulada, o fusión de soluciones.
Perspectivas
![Page 34: Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional](https://reader034.vdocuments.mx/reader034/viewer/2022042614/559bf7a11a28ab2e018b47bc/html5/thumbnails/34.jpg)
Este trabajo a recibido financiación de CONICET (beca doctoral), y FONCyT (PICT 1314).
P. Hovenkamp ha mostrado un gran interés y retroalimentación al proyecto.
C.A. Szumik, P.A. Goloboff, D. Casagranda, S. Catalono y M. Mirande han proporcionado ideas, discusión y apoyo.
Agradecimientos