generador de genes (gengen)

Upload: gabriel-garduno-soto

Post on 04-Jun-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/14/2019 GENERADOR DE GENES (GENGEN)

    1/4

    GENERADOR DE GENES (GENGEN)

    GABRIEL GARDUO SOTO Y HUGO PADILLA CHACN

    DIVISIN DE ESTUDIOS DE POSGRADO DE LAFACULTAD DE FILOSOFA Y LETRAS UNAM.

    MXICO

    Introduccin

    En el seno de la biologa moderna permanece, casi intacto, un ncleo de problemas fundamentales, a los cualesno se les ha encontrado una cabal solucin. Problemas tan elementales como la definicin misma del ser vivo, la

    dilucidacin de complejas relaciones metablicas, el mecanismo de accin de la autocatlisis del ARN; elproblema del origen de la vida y de la evolucin molecular abitica son tan slo algunos de los problemas quemantienen ocupados a los pensadores biolgicos de este siglo.

    Actualmente se han elaborado esquemas cognoscitivos provenientes de distintos horizontes epistemolgicospara aproximarse conceptualmente hacia la solucin de dichos problemas, pues la envergadura de stos haexigido a la disciplina biolgica un replanteamiento de sus presupuestos ms bsicos ya sean de naturalezaontolgica, lgica o metodolgica, tal como aconteciera previamente con la ciencia fsica, a principios del siglo.Y al igual que en la fsica, hoy en da en la biologa, el cultivo de las disciplinas y tcnicas computacionalesocupa un lugar destacado como adyuvante de este colosal esfuerzo que despliega el hombre como especie porallanar el camino hacia la comprensin del mundo viviente.

    En este marco de circunstancias, vemos cmo diversas visiones cientficas estocsticas o deterministasencuentran en la computacin la herramienta de trabajo sin la cual, no sera posible, ni siquiera aventurarhiptesis que para poder ser planteadas y exploradas, requieren de una gran cantidad de clculos en tiemposfinitos y accesibles.

    Uno de estos casos es el que nos proponemos tratar en esta reunin. A saber: el problema que representanuestra actual incapacidad para explicar la organizacin secuencial de las bases pricas (Adenina y Guanina) ypirimdicas (Citosina, Timina -Uracil en ARN-) en la formacin de una hebra de cido nucleico (ADN o ARN).

    Antecedentes de la problemtica

    Jacques Monod plantea en su libro, El Azar y la Necesidad(1970), la aparentemente insalvable dificultad parapredecir las secuencias genmicas o para encontrar un orden en la sucesin de ellas; sin embargo, no descartala posibilidad de que en el futuro la razn o conjunto de reglas que gobiernan las secuencias genmicas,pudieran ser encontradas.

    As pues, henos aqu veintidos aos despus de la publicacin de El Azar y la Necesidad, y si bien an no seha encontrado una solucin completa al problema que inquietaba a Monod, es necesario reconocer que se handado algunos pasos adelante, pues Monod plantea en su libro como hiptesis la existencia de una invariancia delas estructuras genticas, responsables de las secuencias polipeptdicas, que sin embargo se encontraranorganizadas puramente al azar. A continuacin citaremos a Jacques Monod:

  • 8/14/2019 GENERADOR DE GENES (GENGEN)

    2/4

    La primera secuencia completa de una protena globular fue descrita en 1952 por Sanger. Esto fue a la vezuna revelacin y una decepcin. En esta secuencia en la que se saba definir la estructura, o sea laspropiedades electivas de una protena funcional (la insulina), ninguna regularidad, ninguna singularidad,ninguna restriccin se revelaba. Aunque, sin embargo, se puede esperar que, a medida que se acumulendocumentos de este tipo, algunas leyes generales de ensamblaje, as como ciertas correlacionesfuncionales, se harn ms claras De estas secuencias, y de su comparacin sistemtica ayudada por losmodernos medios de anlisis y de clculo, se puede hoy deducir la ley general: la del azar.Para ser ms precisos: estas estructuras estn al azar en el sentido que, conociendo exactamente elorden de 199 residuos en una protena que comprende 200, es imposible formular ninguna regla, terica oemprica, que permita prever la naturaleza del nico residuo no identificado an por el anlisis.1

    Como podemos ver en la cita, el azar al cual se refiere Monod, no es un azar intrnseco, acerca del cual setuviera una prueba formal de su aleatoriedad; el azar de Monod es ms bien un azar provisorio, unconcepto-herramienta, para tratar la complejidad de las estructuras secuenciales que an no podemosinterpretar, en el caso de que efectivamente, existan estructuras en dichas secuencias.

    Regresemos al texto original de Monod:

    Decir de la secuencia de los aminocidos en un polipptido que est al azar, no agrega nada, hay queinsistir en ello, a una declaracin de ignorancia; sino que expresa una constatacin de hecho: por ejemplo,frecuencia media con la cual el residuo est seguido de uno determinado en los polipptidos es igual alproducto de las frecuencias medias de cada uno de los residuos en las protenas en general.2

    Cabe mencionar que el resultado anterior fue obtenido analizando centenares de secuencias con unacantidad no muy grande de nucletidos. Actualmente, con los mtodos de anlisis bioqumico como lossecuenciadores automticos y las computadoras modernas es posible estudiar y analizar miles y hasta millonesde dichas secuencias. En este universo expandido de anlisis han comenzado a surgir algunos indicios acercade la posibilidad de que el azar en las secuencias genmicas, conozca ciertas estructuras. Si bien siguesiendo cierto que an no podemos interpretarlas.

    De hecho, en la dcada de los ochenta el anlisis computarizado de ingentes colecciones de datos genmicoscomenz a arrojar alguna luz sobre la posible existencia de regularidades en las cadenas genticas. RuthNussinov (1987) revisa los reportes existentes sobre el tema y nos dice:

    Ms recientemente ha sido mostrado que las frecuencias de ocurrencia de dinucletidos no fluctanaleatoriamente en secuencias de ADN de procariotes ni de eucariotes Algunos dinucletidos seencuentran presentes ms que otros, por ejemplo AA > AT, GC > CA y TG > TA en secuenciasprocariticas, o TG > GA, CT > AC y CA > TC en secuencias eucariticas. Tambin es posible discernir

    jerarquas, e.g. GC > AT > GT > TA en la mayora de las secuencias procariticas probadas, conaproximadamente 122, 000 nucletidos o GC > GC > GT > TA > CG en la mayor parte de las 256secuencias eucariticas analizadas (con exclusin de las mitocondriales) totalizando aproximadamente290,000 nucletidos.3

    Recientemente se han analizado reportes sobre las frecuencias de ocurrencia de codones (tripletes de basespricas y pirimdicas) en las cadenas genmicas:

    Entonces, los codones deberan estar presentes en aproximadamente iguales frecuencias y losaminocidos en las protenas a frecuencias aproximadamente proporcionales al nmero de codones que

    los codifican. Se conoce ahora que esto no sucede.4

    Hasta la fecha no se ha publicado ningn reporte fidedigno que haya resuelto el problema biocibernticoplanteado por Jacques Monod en 1970.

    El Generador de Genes

    En este marco de referencias, los autores de este trabajo, presuponen, como hiptesis de trabajo, la posibilidadde que las secuencias genmicas y por ende las secuencias polipeptdicas posean una estructura ofamilias de estructuras determinadas.

    En el desarrollo del trabajo presentado, se revisaron distintos enfoques tericos y computacionales modelosde tipo biociberntico,5,6,7estadstico, pseudo-azaroso,8 fractal,9markoviano, de autmatas10,11 y autmatascelulares,12,13 tambin se revisaron estudios sobre las necesidades termodinmicas que prevalecen en el

    2

  • 8/14/2019 GENERADOR DE GENES (GENGEN)

    3/4

    microambiente intermolecular del acoplamiento secuencial de las mencionadas bases pricas y pirimdicas.(Estudios estos ltimos, que rebasaban los propsitos y recursos de los autores), que pudieran servir de apoyopara lograr mediante simulacin computarizada la creacin original de cadenas de nucletidos bajo una razn deconstruccin lgico-matemtica, cadenas que una vez creadas estaran destinadas a la bsqueda de sushomologas con secuencias genmicas reales.

    Encontrando que los enfoques ms recientes desarrollaban, salvo algunas excepciones, a lo sumo juegosmatemticos formales como el Juego de la Vida,14 los autores decidieron, a su vez realizar un enfoquepropio, basado en la teora de nmeros y en la lgica clsica. Ya que nuestro propsito inicial fue ilustrar,mediante un ejemplo biolgico, otras aplicaciones de la lgica clsica y sus posibilidades. En rigor, nuestroenfoque apunta hacia la dilucidacin de las razones, que gobiernan la concatenacin de las secuencias

    genmicas, que presuponemos expresables a travs de un enfoque lgico, hiptesis atrevida, con miras aaplicar un modelo similar a las estructuras estricas reales, dilucidadas o predichas, en el laboratorio qumico obiomatemtico, respectivamente campo an muy reciente.

    As pues, en nuestro enfoque, hemos desarrollado una visin lgica del fenmeno, donde se simula unapropuesta arbitraria que presupone en cada base prica y pirimdica, dos sitios activos, sin ningncomportamiento de cooperacin, disponibles para la interaccin de concatenacin, que se suponen, tambinarbitrariamente, como sitios que se comportan como una aplicacin de los operadores lgicos tradicionales, paraproducir tericamente la siguiente posicin nucleotdica en la cadena. (En modo muy similar a la construccin dela serie de Fibonacci).

    De este modo el programa concreto qued organizado de la siguiente manera:

    a) El programa lo constituyen varios subprogramas algortmicos algunos algoritmos son de orden 5,posee un generador de nmeros asociados mediante un algoritmo (no-azaroso y formalmente indecidible) yaplica a dichos nmeros los operadores lgicos tradicionales y combinaciones de ellos. El proceso anteriorvierte sus resultados de acuerdo con el cdigo gentico, para ir produciendo la cadena de secuencias

    genmicas. En cada caso, el programa parte de condiciones iniciales definidas por el usuario; a saber:b) Eleccin de una asignacin numrica para cada base prica o pirimdica. (8 Opciones).15

    c) Eleccin del codn inicial (numrico) correspondiente al iniciador bioqumico Metionina.d) Eleccin del codn secundario (numrico) entre cualquiera de los 64 posibles tripletes del cdigo

    gentico.e) Eleccin de dos nmeros de arranque que funcionan como semilleropara el generador numrico.f) Eleccin de las condiciones de visualizacin de la secuencia genmica generada: 1) En cdigo internacional de

    literales para cada aminocido, 2) En abreviatura tradicional para aminocidos, 3) En una secuenciapropiamente genmica de tripletes de bases pricas y pirimdicas 4) En una concatenacin numrica querepresenta la salida del programa, para fines de estudio.

    g) Eleccin de lectura y desplegado para los StopsAmbar, Ocrey palo.

    Dada la longitud y profusin de los resultados, stos se visualizan en pantalla y se registran en disco duro oflexible, para su anlisis posterior.

    El programa ofrece grandes posibilidades de experimentacin terica y de estudio de condiciones deconcatenacin genmica al usuario ya que sus posibles condiciones inciales son superiores a treinta y dos mildoscientos millones de combinaciones.

    Resultados

    El programa puede generar cadenas genmicas de longitud variable, dependiendo de las condiciones dearraque, en teora podra generar cadenas de longitud ilimitada, dependiendo del tiempo de proceso disponible.La operacin se lleva a cabo en computadoras PC con un mnimo de 640 Kb de memoria RAM, y escompletamente portable a cualquier sistema de cmputo independientemente del lenguaje de programacin quese utilice, dado que la efectividad del sistema reside principalmente en los algoritmos bsicos de operacinautnoma y no en aplicaciones dependientes del lenguaje usado ni de la versin utilizada.

    Por otra parte, en su operacin, el programa muestra comportamiento de auto-organizacin y actualmentemuestra una tendencia hacia la estabilizacin de las secuencias producidas. Se piensa introducir posteriormenterutinas de autoregulacin, para aumentar la longitud de las cadenas producidas.

    3

  • 8/14/2019 GENERADOR DE GENES (GENGEN)

    4/4

    Actualmente se analizan algunas salidas interesantes del programa investigando homologas con cadenas denucletidos reales, a travs de consulta directa con los bancos de datos del proyecto Genoma Humano y deGenBank.

    Un producto secundario del programa lo constituye la utilidad de almacenamiento compactado de las cadenasartificiales, que compartan homologas con cadenas reales, en los sistemas de cmputo, con ahorro de memoriay tiempo de transmisin por vas de comunicacin electrnica.

    Bibliografa

    1 Jacques Monod. El Azar y la Necesidad. Ensayo sobre la filosofa natural de la biologa moderna . CuadernosInfimos 100. Tusquets, Barcelona, 1981. (Edicin original en francs de Editions de Seuil, Paris, 1970).

    2 Ibid.

    3 Ruth Nussinov. Theoretical Molecular Biology: Prospectives and Perspectives. J. Theor. Biol. 125: 219-235,1987.

    4 Curnow. R.N. The Use of Markov Chain Models in Studying the Evolution of the Proteins. J. Theor. Biol. 134:51-57, 1988.

    5 Michael Conrad. Molecular Computing as a Link between Biological and Physical Theory. J. Theor. Biol. 98:239-252, 1982.

    6 Motoyosi Sugita. Functional Analysis of Chemical Systems in vivo using a Logical Circuit Equivalent. J.Theor. Biol. 1: 415-430, 1961.

    7 Motoyosi Sugita. Functional Analysis of Chemical Systems in vivousing a Logical Circuit Equivalent. II. TheIdea of a Molecular Automaton. J. Theor. Biol. 4: 179-192, 1963.

    8 Kauffman S.A. Metabolic Stability and Epigenesis in Randomly Constructed Genetic Nets. J. Theor. Biol. 22:437-467, 1969.

    9 David L. Finkel. Fractal Displays of Genomic DNA. I. Eco RI Fractal Lattice of Buffalo Rat. Int. Jour. ofQuantum Chemistry. XXXVI: 575-586, 1989.

    10 Narendra S. Goel et al.: Movable Finite Automata (MFA) Models for Biological Systems. II. ProteinBiosynthesis. J. Theor. Biol. 134: 9-49, 1988.

    11 Ren Thomas. Regulatory Networks Seen as Asynchronous Automata: A Logical Description. MiniReview. J. Theor. Biol.153: 1-23, 1991.

    12 Stauffer D. Computer Simulations of Cellular Atomata. J. Phys. A: Math. Gen.24: 909-927, 1991.

    13 Wolfram S. Universality and Complexity in Cellular Automata. Physica10D: 1-35, 1984.

    14 Bagnoli F., Rechtman R., Ruffo S. Some Facts about Life. Physica A171: 249-264, 1991.

    15 La asignacin numrica inicial y las transformaciones numricas ulteriores fueron diseadas por los autores

    para las necesidades del modelo. El lector interesado puede referirse a mtodos similares en: Seplveda A. etal. Storage and Retrieval of Biomolecule Sequences. J. Theor. Biol. 103: 331-332, 1983. Johnson F.Y.,et al.Prime Numbers and the Amino Acid Code: Analogy in Coding Properties. J. Theor. Biol. 151: 333-341, 1991.

    4