![Page 1: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/1.jpg)
ENSAMBLAMIENTO DE FRAGMENTOS DE ADN
Matías Brunstein Macri
Alejandro Pedraza
Jimena Rinaldi
2004Introducción a la Biología Computacional
Departamento de Computación-FCEN-UBA.
![Page 2: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/2.jpg)
Primera Parte
Biological Background
![Page 3: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/3.jpg)
Genoma. Complemento genético entero y haploide de un organismo. Es decir toda la secuencia de ADN, codificante o no codificante y su posición en los cromosomas.
Genómica. Disciplina que se ocupa de la caracterización de los genomas. Se encuentra dividida en Genómica Estructural y la Genómica Funcional.
Objetivo de la Genómica Estructural es conocer el/los genoma/s de una especie en particular/diferentes especies.
.
Genoma y Genómica
![Page 4: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/4.jpg)
Aplicaciones delestudio de los genomas Predecir genes, secuencias promotoras y
reguladoras de la transcripción. Comparar genomas de diferentes
individuos de la misma especie para detectar variaciones o polimorfismos a nivel poblacional. Estas variaciones pueden ser sustituciones, deleciones/inserciones, o rearreglos cromosómicos (cambio de posición en el genoma).
![Page 5: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/5.jpg)
Aplicaciones delestudio de los genomas Comparar genomas de diferentes
especies. Esto permite hacer inferencias acerca de los procesos evolutivos de remodelación de genomas.
Otras.
![Page 6: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/6.jpg)
Genomas eucarióticos y procarióticos
![Page 7: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/7.jpg)
Genomas animales y vegetales
![Page 8: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/8.jpg)
Sizes of eukaryotic genomes
Species Genome size (Mb)
Fungi Saccharomyces cerevisiae 12.1Aspergillus nidulans 25.4
Protozoa Tetrahymena pyriformis 190
Invertebrates Caenorhabditis elegans 97
Drosophila melanogaster 180Bombyx mori (silkworm) 490Strongylocentrotus purpuratus (sea urchin) 845Locusta migratoria (locust) 5000
Vertebrates Takifugu rubripes (pufferfish) 400
Homo sapiens 3200Mus musculus (mouse) 3300
Plants Arabidopsis thaliana (vetch) 125Oryza sativa (rice) 430Zea mays (maize) 2500Pisum sativum (pea) 4800Triticum aestivum (wheat) 16000Fritillaria assyriaca (fritillary) 120000
![Page 9: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/9.jpg)
Paradoja del valor C
![Page 10: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/10.jpg)
Secuencias repetitivas Distintos tipos de secuencias repetitivas
se encuentran en muchos organismos y ocupan gran parte de los genomas: Satélites Pseudogenes Transposones y retrotransposones
Pueden estar esparcidas por el genoma o en tandem y varían mucho en tamaño.
![Page 11: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/11.jpg)
¿Cómo se estudian los genomas? Mapeo genético Mapeo físico Secuenciación exhaustiva
![Page 12: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/12.jpg)
El mapeo genético
El mapeo genético está basado en la utilización de técnicas genéticas para construir mapas que muestran la posición de marcadores genéticos o de marcadores moleculares. Las técnicas genéticas incluyen experimentos de recombinación y estudio de pedigrees en humanos.
![Page 13: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/13.jpg)
El mapeo físico
El mapeo físico utiliza técnicas de Biología Molecular para examinar directamente las moléculas de ADN para la construcción de mapas que muestran la posición de fragmentos de ADN (en general de secuencia desconocida) en el genoma.
![Page 14: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/14.jpg)
Secuenciación automáticaFragmentos de hasta 700 pb
![Page 15: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/15.jpg)
![Page 16: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/16.jpg)
Bibliotecas genómicas Como no es posible secuenciar un genoma
en una sola reacción de secuenciación se lo divide en fragmentos, los cuales se almacenan en clones bibliotecas genómicas.
Una biblioteca genómica es un conjunto de clones, cada uno de los cuales contiene un fragmento de un genoma de un organismo dado.
Las bibliotecas genómicas se consiguen clonando los fragmentos en vectores.
![Page 17: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/17.jpg)
Clonado de fragmentos
![Page 18: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/18.jpg)
Vectores de clonado utilizados para secuenciación de genomas
Fago λ
Cósmido
YAC
![Page 19: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/19.jpg)
Vectores de Clonado
Problema de los YACs
![Page 20: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/20.jpg)
Vectores de Clonado Otros vectores que incluyen insertos
de gran tamaño: Bacteriógafos P1 BACs PACs Fósmidos
![Page 21: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/21.jpg)
Sizes of human genomic libraries prepared in different types of cloning vector
Number of clones*Type of vector Insert size (kb)
P = 95% P = 99%
replacement 18 532 500 820 000
Cosmid, fosmid 40 240 000 370 000
P1 125 77 000 118 000
BAC, PAC 300 32 000 50 000
YAC 600 16 000 24 500
Mega-YAC 1400 6850 10 500
* Calculated from the equation:where N is the number of clones required, P is the probability that any given segment of the genome is present in the library, a is the average size of the DNA fragments inserted into the vector, and b is the size of the genome.
![Page 22: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/22.jpg)
Ensamblado:Shotgun approach
Consiste en ensamblar directamente los fragmentos de ADN secuenciados por superposición.
![Page 23: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/23.jpg)
Haemophilus influenzae
19951830 kb, biblioteca genómica
18.638 clones,
insertos de 1,6-2 kb.
![Page 24: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/24.jpg)
Resolución de gaps
![Page 25: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/25.jpg)
Los contigs se pueden construir por chromosome walking
![Page 26: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/26.jpg)
![Page 27: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/27.jpg)
Ensamblado:Clone Contig Approach Se clonan fragmentos de hasta 1,5
Mb en YACs o BACs. Se construye un contig identificando
los clones que contienen fragmentos superpuestos, los cuales se secuencian por el método de shotgun.
![Page 28: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/28.jpg)
Whole genome shotgun sequencing La experiencia con el método de shotgun en
genomas chicos mostró que si el largo total de la secuencia que se genera es 6,5-8 veces el largo de la secuencia total del genoma estudiado, entonces los contigs resultantes ocuparan el 99,8% de la secuencia del genoma, con unos gaps tales que se pueden resolver facilmente.
70 millones de fragmentos de 500pb resolverían el genoma humano en 3 anos con 75 secuenciadores, cada uno de los cuales puede secuenciar 1000 secuencias de esas por días.
![Page 29: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/29.jpg)
Ejemplo de genomas de los cuales se ha publicado la secuencia en versión completa o borrador
Especie Tamaño del genoma (Mb) Nro de genes estimados
Eukarya
Arabidopsis thaliana (plant) 125 25 500
Caenorhabditis elegans (nematode) 97 19 000
Drosophila melanogaster (fruit fly) 180 13 600
Homo sapiens (human) 3200 30 000 - 40 000
Saccharomyces cerevisiae (yeast) 12.1 5800
Eubacteria
Escherichia coli K12 4.64 4400
Mycobacterium tuberculosis H37Rv 4.41 4000
Mycoplasma genitalium 0.58 500
Pseudomonas aeruginosa PA01 6.26 5700
Streptococcus pneumoniae 2.16 2300
Vibrio cholerae El Tor N16961 4.03 4000
Yersinia pestis CO92 4.65 4100
Archeae
Archaeoglobus fulgidus 2.18 2500
Methanococcus jannaschii 1.66 1750
![Page 30: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/30.jpg)
Complicaciones Instancias reales del problema muy
largas Errores
Inserciones Deleciones sustituciones
Fragmentos quiméricos Orientación desconocida Regiones repetidas Pérdida de cobertura (gaps)
![Page 31: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/31.jpg)
Segunda Parte
Modelos
![Page 32: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/32.jpg)
¿Qué es un modelo? Es una abstracción de la realidad
que nos facilita el estudio de un fenómeno o problema.
Un modelo no es un algoritmo Como veremos más adelante, para un
mismo modelo pueden plantearse varios algoritmos.
![Page 33: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/33.jpg)
Modelos para el ensamblamiento de ADN
Plantearemos tres modelos teóricos.1. Shortest Common Superstring2. Reconstruction3. Multicontig
Cada uno plantea distintas restricción sobre los fragmentos.
Se asume que las muestras están libres de contaminación.
![Page 34: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/34.jpg)
Primer Modelo:Shortest Common Superstring
Tiene principalmente interés teórico pues no es muy útil en la realidad.
Plantea muchas restricciones: Los fragmentos no deben tener errores Deben estar orientados correctamente La secuencia buscada no debe tener
repeticiones
![Page 35: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/35.jpg)
SCS: Definición
Dado un conjunto de strings F, hallar un string S de longitud mínima tal que para todo string f en F, f es substring de S.
Notar que S debe ser un superstring perfecto, por lo que no permites errores experimentales.Se debe conocer la orientacíon de cada string f.
![Page 36: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/36.jpg)
SCS: Ejemplo
F = {ACT, CTA, AGT}
S = ACTAGT
A C T
C T A
A G T
S = A C T A G T
![Page 37: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/37.jpg)
SCS: Repeticiones
Supongamos que secuenciamos la siguiente cadena de nucleótidos
S = ACTTGTAAGGTTGTTAAG
de la cual obtenemos los siguientes fragmentos
F = {ACTT, TTGTAA, AAGGT, TTGT, GTT, TTAG}
![Page 38: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/38.jpg)
SCS: Repeticiones (Cont.)Según este modelo, el resultado de hallar el SCS de F sería:
A C T T
T T G T A A
A A G T
T T G T
G T T
T T A G
S’ = A C T T G T A A G T T A G
![Page 39: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/39.jpg)
SCS: Resumen No admite repeticiones No admite errores experimentales Se debe conocer la orientación de
los fragmentos. Es un problema NP-Hard. No resulta práctico para aplicaciones
reales debido a la gran cantidad de restricciones y limitaciones.
![Page 40: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/40.jpg)
¿Qué significa NP-Hard? NP-Completo se refiere a una familia
de problemas de decisión para los cuales no se conoce una solución polinomial.
Los problemas de decisión son aquellos para los que se espera una respuesta del tipo “sí” o “no”.
![Page 41: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/41.jpg)
¿Qué significa NP-Hard? En el caso del TSP, el problema
sería:¿Existe un camino que pase por todas las ciudades exactamente una vez recorriendo una distancia menor a 500 Km.?
La respuesta esperada es simplemente “sí” o “no”.
![Page 42: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/42.jpg)
¿Qué significa NP-Hard? Un problema HP-Hard es el problema
de optimización asociado a un problema NP-Completo.
En nuestro caso:¿Cuál es el camino más corto que pasa exactamente una vez por cada ciudad?
![Page 43: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/43.jpg)
Segundo Modelo:Reconstruction
Este modelo tiene en cuenta: Errores. Orientación desconocida
Pero no modela: Repeticiones Falta de cubrimiento
![Page 44: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/44.jpg)
Reconstruction: Definiciones
Para entender como este modelo considera los errores debemos contar con algunas definiciones previas. Distancia de edición (o edit distance) Distancia de edición de substrings (o substring edit distance) Substring aproximado
![Page 45: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/45.jpg)
Distancia de Edición
Dadas dos cadenas a y b, llamaremos distancia de edición, y lo notaremos d(a, b), a la cantidad de inserciones, deleciones y/o substituciones que deben realizarse sobre las cadenas para que valga a = b.Ejemplo: d(ACTGT, AGGT) = 2
pues ACTGT = ACTGT
Substitución Inserción
![Page 46: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/46.jpg)
Distancia de Edición de Substrings
Dadas dos cadenas a y b, llamaremos distancia de edición de substrings a:
),(min),()(
sadbadbSs
s
donde S(b) es el conjunto de los substrings de b. Ejemplo: ds(ACT, GATTACA) = 1Pues d(ACT, ACA) = 1 y ACT S(b)
![Page 47: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/47.jpg)
Substring AproximadoSea un número real entre 0 y 1. Un string f es un substring aproximado de S con error cuando
fSfd s ),(
donde |f| es la longitud del string f.Por ejemplo: si = 0.05, permitiremos que f difiera en a lo sumo un 5% con el substring màs cercano en S.
![Page 48: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/48.jpg)
Reconstruction: Definición
fSfdSfd ss ),(),,(min
Dado un conjunto de strings F y una cota de error entre 0 y 1, hallar un string S de longitud mínima tal que para todo string f en F
donde f es el string reverso y complementario a f.
![Page 49: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/49.jpg)
Reconstruction: Resumen No admite repeticiones ni espacios
no cubiertos Admite errores experimentales Modela la orientación desconocida Es un problema NP-Hard. SCS es un caso particular de este
modelo.
![Page 50: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/50.jpg)
Tercer Modelo:Multicontig:
Introduce la noción de buen enlace. Este modelo tiene en cuenta:
Errores. Orientación reconocida Falta de cubrimiento En algunos casos, repeticiones
![Page 51: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/51.jpg)
Multicontig: DefinicionesLlamaremos layout a un alineamiento múltiple de un conjunto de secuencias.El siguiente layout será utilizado como ejemplo en varias definiciones:
f1: C T T G T A
f2: T G T A G T T
f3: C T A T
f4: T A T T
f5: G T A G T
![Page 52: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/52.jpg)
Multicontig: Definiciones (cont.)Diremos que dos fragmentos f y g se solapan (y lo llamaremos overlap) si comparten una o más columnas en el layout. Es decir, si ambos string se intersecan.
f1: C T T G T A
f2: T G T A G T T
f3: C T A T
f4: T A T T
f5: G T A G T
![Page 53: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/53.jpg)
Multicontig: Definiciones (cont.)
Podemos separar los overlaps en dos categorías: Los que producen un enlace. (f3 – f4)
y los que no lo producen. (f2 – f5)
f1: C T T G T A
f2: T G T A G T T
f3: C T A T
f4: T A T T
f5: G T A G T
![Page 54: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/54.jpg)
Multicontig: Definiciones (cont.) El enlace más débil (weakest link) es
aquél overlap con menor longitud que produce un enlace.
Diremos que un layout es un t-contig si el enlace más débil que posee tiene longitud t.
Si es posible obtener un t-contig de un conjunto de fragmentos F, diremos que F admite un t-contig.
![Page 55: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/55.jpg)
Multicontig: Definición ILibre de Errores
Dado un conjunto de strings F y un entero t, particionar F en el mínimo número de subconjuntos Ci, 1 ≤ i ≤ k, tal que cada Ci admita un t-contig.
![Page 56: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/56.jpg)
Multicontig: EjemplosDado F = {GTAC, TAAG, TGTAA}
Si t = 3T A A T G G T A C
T G T A A
Si t = 2T A A T G G T A C
T G T A A
Si t = 1T G T A A
T A A T G
G T A C
![Page 57: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/57.jpg)
Multicontig: Contemplando errores
Si se admiten errores en el acoplamiento, se debe obtener una cadena por consenso que será el resultado del ensamblamiento.
Diremos que S es una cadena -consensuada de F si, para cada cadena f en F, la distancia de edición entre f y su imagen en S es ≤ | f |.
![Page 58: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/58.jpg)
Multicontig: Contemplando errores
Por ejemplo: S es una cadena 0.20 – consensuada con respecto a F.
f1: C T T C T A
f2: T G T T G T T
f5: G T A G T
S C T T G T A G T T
![Page 59: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/59.jpg)
Multicontig: Definición IIAdmitiendo de Errores
Dado un conjunto de strings F, un entero t ≥ 0 y una tolerancia de error entre 0 y 1, particionar F en el mínimo número de subconjuntos Ci, 1 ≤ i ≤ k, tal que cada Ci admita un t-contig con un consenso .
![Page 60: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/60.jpg)
Multicoting: Resumen Admite repeticiones en algunos
casos. Admite errores experimentales Modela la orientación desconocida Es un problema NP-Hard.
![Page 61: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/61.jpg)
Tercera Parte
Algoritmos
![Page 62: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/62.jpg)
Repaso de Grafos Los grafos son artefactos
matemáticos que permiten expresar de una forma visualmente sencilla y efectiva las relaciones que se dan entre elementos de muy diversa índole.
![Page 63: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/63.jpg)
Repaso de Grafos Un grafo simple está formado
por dos conjuntos: Un conjunto V de puntos
llamados vértices o nodos. Un conjunto E de pares de
vértices que se llaman aristas o arcos y que indican qué nodos están relacionados.
Notación: G(V,E)
x
x y
![Page 64: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/64.jpg)
Repaso de Grafos A los ejes se les puede asignar
un peso. Notación: w(x,y) Si hay más de un arco
hablamos de un multigrafo Si los arcos se recorren en una
en una dirección concreta pero no en la contraria lo llamamos grafo dirigido o dígrafo y los arcos son aristas
x y8
x y
x y
x y
![Page 65: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/65.jpg)
Repaso de Grafos Un Camino es una secuencia de
vértices V1, V2, V3, ... , Vn, tal que cada para uno de estos V1->V2, V2->V3, V1->V3
Un Camino Simple es cuando todos sus vértices, excepto tal vez el primero y el último son distintos.
Un Ciclo Simple es un camino simple de longitud por lo menos de uno que empieza y termina en el mismo vértice.
Se dice que un grafo es aciclíco cuando no contiene ciclos.
v1
v2
v3
v4
v1
v2
v3
v4
v1
v2
v3
v1
v2
v3
![Page 66: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/66.jpg)
Representado el problema como un grafo Se representa con un grafo ya que
resulta mas amigable para verlo visualmente, y se le esta aportando al problema, todo un conjunto de herramientas matemáticas para resolverlo.
![Page 67: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/67.jpg)
Representado el problema como un grafo Datos del problema:
Un conjunto de fragmentos F F = {ACTT, TTGTAA, AAGGT, TTGT, GTT, TTAG}
Un string S S = ACTTGTAAGGTTGTTAAG
El overlap de los fragmentos ACTT TTGTAA
![Page 68: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/68.jpg)
Representado el problema como un grafo Datos del problema:
El orden en que se hace el overlap ACTT TTGTAA TTGTAA ACTT
La cantidad de nucleotidos que están en el overlap ACTT TTGTAA 2 nucleótidos
![Page 69: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/69.jpg)
Representado el problema como un grafo Fragmentos son representados por los
nodos o vértices. Los overlap’s son representados por los
ejes que unen a los nodos. El orden del overlap de dos fragmentos,
esta dado por la dirección del eje o arista. La cantidad de nucleótidos que estan en
el overlap de dos fragmentos, esta representado por el peso de los ejes.
El string s se representa como un camino en el grafo.
![Page 70: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/70.jpg)
Representado el problema como un grafo Ejemplo:
F={TACGA, ACCC, CTAAAG, GACA} a b c d
a
dc
b
200
0
0
0
0
0
1
1
1
1
![Page 71: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/71.jpg)
Representado el problema como un grafo Ejemplo:
F={TACGA, ACCC, CTAAAG, GACA} a b c d
a
dc
b
2
1
1
1
1
![Page 72: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/72.jpg)
Representado el problema como un grafo Ejemplo:
F={TACGA, ACCC, CTAAAG, GACA} a b c d
S1= TACGACCCCTAAAGACAS2= TACGACACCCTAAAG
a
dc
b2
1
1
1
1
a
dc
b2
1
1
1
1
![Page 73: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/73.jpg)
Representado el problema como un grafo Problema:
Encontrar el superstring mas corto. Esto es equivalente a encontrar un camino hamiltoniano máximo dentro del grafo. Este problema es NP-Completo
![Page 74: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/74.jpg)
Algoritmos Greedy
Aplica al modelo SCS y Reconstruction
Subgrafo AcíclicoAplica al modelo Multiconting
![Page 75: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/75.jpg)
Algoritmo Greedy En cada paso intenta maximizar la
solución del subproblema analizad. No retrocede una vez tomada cada decisión.
![Page 76: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/76.jpg)
Algoritmo Greedy Construimos un grafo dirigido a
partir del multigrafo formado por los fragmentos de F, dejando entre cada par de nodos únicamente las aristas mas pesadas, ya que estamos buscando el camino mas pesado
![Page 77: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/77.jpg)
Algoritmo Greedy Entrada: Grafo orientado con n vértices. Salida: Camino hamiltoniano en el grafo de entrada//InicioPara i<-1 hasta n
in[i] <-0 //cuantos ejes entran en iout[i] <-0 // cuantos ejes salen de iMakeSet(i)
//ProcesoOrdenar los ejes de acuerdo a a su peso, con el mas pesado primeroPara cada eje (f,g) en ese orden
Si in[g] = 0 y out[f] = 0 y FindSet(f) =/= FindSet(g)seleccionamos el eje (f,g)in[g] <- 1out[f] <- 1Union(FindSet(f), FindSet(g))
Si queda una sola componenteterminar
Retornar los ejes seleccionados
![Page 78: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/78.jpg)
Algoritmo Greedy La solución encontrada es a lo sumo
2,75 veces peor que la optima, y se conjetura que lo es 2 veces.
Este algoritmo, no siempre encuentra una solución.
TGCAT ATGC GCC3
22
![Page 79: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/79.jpg)
Algoritmo Subgrafo Acíclico Este algoritmo restringe la hipótesis,
asumiendo que los fragmentos están libres de errores, que se conoce la orientación y que fueron obtenidos de un buen secuenciamiento.
Se entiende por buen secuenciamiento, básicamente, a que los fragmentos cubren a la molécula en su totalidad y que se garantiza el overlap.
![Page 80: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/80.jpg)
Algoritmo Subgrafo Acíclico Dado un multigrafo con los fragmentos en los
nodos, obtenemos un grafo dirigido, quedándonos con las aristas de mayor peso entre los nodos, ya que queremos encontrar el camino mas pesado.
Luego quitamos todas las aristas que tengan un peso menor al t-contig deseado. De forma tal que quede un subgrafo acíclico
Luego se busca un camino hamiltoniano máximo en el subgrafo acíclico. Esto es polinomial y se puede resolver con un algoritmo greedy.
![Page 81: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/81.jpg)
Algoritmo Subgrafo Acíclico Ejemplo:
Consideremos que queremos llegar al string S y tenemos los fragmentos w, z, u, x e y
S = AGTATTGGCAATCGATGCAAACCTTTTGGCAATCACTw = AGTATTGGCAATC z = AATCGATGu = ATGCAAACCTx = CCTTTTGGy = TTGGCAATCACT
Y se pide un t-contig de 3
![Page 82: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/82.jpg)
Algoritmo Subgrafo Aciclico El subgrafo acíclico de de los
overlap’s quedaría de la siguiente forma:
4
9
3 3 4
![Page 83: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/83.jpg)
Heurística Buscar overlap
Para cada par de fragmentos, calcular el match prefijo-sufijo.
Usar el algoritmo de programación dinámica de alineamiento semiglobal sin penalidad.
Ordenar los fragmentos Construir el camino con un algoritmo greedy o
heurística Cada camino tiene su correspondiente camino
complementario No es necesario incluir fragmentos incluidos en otros Los ciclo y cubrimientos abundantes pueden indicar
repeticiones. Alineamiento y consenso
![Page 84: ENSAMBLAMIENTO DE FRAGMENTOS DE ADN Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi 2004 Introducción a la Biología Computacional Departamento](https://reader036.vdocuments.mx/reader036/viewer/2022062807/5665b4341a28abb57c8ff840/html5/thumbnails/84.jpg)
Bibliografía Brown, T. A., Genomes, 2002, 2nd.
Edition, BIOS Scienfic Publishers, Ltd. Griffiths A., Miller J., Suzuki D. & Lewontin
R, An Introduction to Genetic Analysis, 2000, 7th ed. Freeman & Company
Meidanes Prevner Baxevanis