présentation de la thèse de julien allali soutenue le 23 décembre 2004 à marne la vallée

Download Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée

Post on 30-Dec-2015

32 views

Category:

Documents

0 download

Embed Size (px)

DESCRIPTION

Lisa ALLALI M1 Bio-Informatique formelle MPRI 2004/2005. Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée Modélisation et comparaison de la structure secondaire de l’ARN - PowerPoint PPT Presentation

TRANSCRIPT

  • Prsentation de la thse de Julien ALLALI soutenue le 23 dcembre 2004 Marne la ValleModlisation et comparaison de la structure secondaire de lARN

    Sous la direction de Maxime Crochemore et Marie France Sagot

    Lisa ALLALI M1Bio-Informatique formelle MPRI 2004/2005

  • Prsentation de la structure des ARN

  • Les ARN sont des squences mono-brin de nuclotides. Dans la cellule o ils exercent de nombreux rles, ils ne restent pas sous forme linaire. Un ARN se replie sur lui-mme et cre des liaisons entre certains de ses nuclotides. Les bases qui ne sont pas lies sont dites non apparies.

    Les 3 formes de lARN sontla structure primaire : squence linaire de nuclotidesla structure secondaire : disposition des nuclotides sur le planla structure tertiaire : disposition des nuclotides dans lespace

    La conformation spaciale de lARN est dtermine et directement lie la fonction de lARN dans la cellule. La structure tertiaire apparait donc naturellement comme la plus adapte pour tudier la fonction dun ARN. Cependant il est admis que 2 ARN ayant une structure secondaire proche auront une fonction molculaire relativement proche.

    Presentation

  • La structure secondaire Les lments de la structure secondaire

    Une hlice est une suite contigu de liaisons entre 2 nuclotides

  • La structure secondaire Les lments de la structure secondaire

    Une hlice est une suite contigu de liaisons entre 2 nuclotides

    Une boucle terminale est une suite de bases non apparies formant une boucle lextremit dune hlice

  • La structure secondaire Les lments de la structure secondaire

    Une hlice est une suite contigu de liaisons entre 2 nuclotides

    Une boucle terminale est une suite de bases non apparies formant une boucle lextremit dune hlice

    Une boucle multiple est le point de rencontre dau moins 3 hlices

  • La structure secondaire Les lments de la structure secondaire

    Une hlice est une suite contigu de liaisons entre 2 nuclotides

    Une boucle terminale est une suite de bases non apparies formant une boucle lextremit dune hlice

    Une boucle multiple est le point de rencontre dau moins 3 hlices

    Une boucle interne relie 2 hlices

  • La structure secondaire Les lments de la structure secondaire

    Une hlice est une suite contigu de liaisons entre 2 nuclotides

    Une boucle terminale est une suite de bases non apparies formant une boucle lextremit dune hlice

    Une boucle multiple est le point de rencontre dau moins 3 hlices

    Une boucle interne relie 2 hlices

    Un renflement est une demie boucle interne

  • La structure secondaire Les lments de la structure secondaire

    Une hlice est une suite contigu de liaisons entre 2 nuclotides

    Une boucle terminale est une suite de bases non apparies formant une boucle lextremit dune hlice

    Une boucle multiple est le point de rencontre dau moins 3 hlices

    Une boucle interne relie 2 hlices

    Un renflement est une demie boucle interne

    Une tige dnote une suite dhlice(s)/boucle(s) interne(s)/(renflement(s)

  • La structure tertiare repliement de lARN

  • Ce qui nous intresse ici est la comparaison des structures secondaires de lARN pour chercher prdire la fonction dun ARN inconnu grce sa ressemblance avec un ARN connu.

    Mais que signifie tre proche pour deux ARN ?

    Comment automatiser cette reconnaissance de ressemblance ?

    Cest ce que nous allons essayer de comprendre pour trouver une rponse satisfaisante la question de la comparaison entre 2 ARN.

    Questions

  • Modlisations existantes

    Vers une formalisation satisfaisante

  • Squences annotes par des arcs Squences de type imbriqu reprsentant un ARN de transfertStructure primaireStructure Secondaire

  • Squences annotes par des arcs Squences de type imbriqu reprsentant un ARN de transfertStructure primaireStructure SecondaireSquence annote modlisant la structure secondaire

  • Les informations conserves par les squences anotes sont aussi bien la suite de nuclotides qui composent lARN que sa structure (helices boucles etc...).

    Toutes ces informations sont-elles ncessaires ?

    Il apparait que cest la structure, plus que la sequence de nuclotides qui dtermine la fonction dun ARN (mme si ces deux aspects ne peuvent tre totalement spars).

    Ainsi on peut imaginer de nouvelles reprsentations des ARN qui sintresseraient de faon plus accentue la structure pour elle-mme.

    Squences annotes par des arcs

  • La structure secondaire se prte assez naturellement une formalisation par des arbres. Voici les tapes dun exemple de construction dun arbre codant la structure secondaire dun ARN. La question qui se pose tant quel est le raffinement de linformation qui nous interesse ?

    Arbres enracins et ordonns

  • La structure secondaire se prte assez naturellement une formalisation par des arbres. Voici les tapes dun exemple de construction dun arbre codant la structure secondaire dun ARN. La question qui se pose tant quel est le raffinement de linformation qui nous interesse ?

    Arbres enracins et ordonns

  • La structure secondaire se prte assez naturellement une formalisation par des arbres. Voici les tapes dun exemple de construction dun arbre codant la structure secondaire dun ARN. La question qui se pose tant quel est le raffinement de linformation qui nous interesse ?

    Arbres enracins et ordonns

  • La structure secondaire se prte assez naturellement une formalisation par des arbres. Voici les tapes dun exemple de construction dun arbre codant la structure secondaire dun ARN. La question qui se pose tant quel est le raffinement de linformation qui nous interesse ?

    Arbres enracins et ordonns

  • La structure secondaire se prte assez naturellement une formalisation par des arbres. Voici les tapes dun exemple de construction dun arbre codant la structure secondaire dun ARN. La question qui se pose tant quel est le raffinement de linformation qui nous interesse ?

    Arbres enracins et ordonns

  • Deux codages possibles avec des granularits diffrentes : Arbres enracins et ordonns Un arc de larbre code pour une hlice ou une tige.Les boucles multiples sont les noeuds internes rougesLes boucles terminales sont les feuilles bleues Les noeuds internes rouges sont les paires de bases apparies. Les feuilles bleues sont les bases non apparies.

  • Voici un ventail de granularisations possibles pour la reprsentation en arbre des structures secondaire de lARN.

    Arbres enracins et ordonns

  • Arbres enracins et ordonns Voici un ventail de granularisation possibles pour la reprsentation en arbre des structures secondaire de lARN.

  • Arbres enracins et ordonns Voici un ventail de granularisation possibles pour la reprsentation en arbre des structures secondaire de lARN.

  • Arbres enracins et ordonns Voici un ventail de granularisation possibles pour la reprsentation en arbre des structures secondaire de lARN.

  • Arbres enracins et ordonns Voici un ventail de granularisation possibles pour la reprsentation en arbre des structures secondaire de lARN.

  • Arbres enracins et ordonns Voici un ventail de granularisation possibles pour la reprsentation en arbre des structures secondaire de lARN.

  • Arbres enracins et ordonns Voici un ventail de granularisation possibles pour la reprsentation en arbre des structures secondaire de lARN.

  • Arbres enracins et ordonns Voici un ventail de granularisation possibles pour la reprsentation en arbre des structures secondaire de lARN.

  • Comparaison de structures

  • La distance ddition entre deux squences dARN se calcule par la somme des cots des oprations successives dinsertion, dltion et substitution ncessaires au passage dune structure lautre. Ces oprations sont rversibles.La distance ddition entre deux squences est donc strictement quivalente au calcul dalignement de deux squences.

    Comparaison distance ddition

  • La distance ddition entre deux squences dARN se calcule par la somme des cots des oprations successives dinsertion, dltion et substitution ncessaires au passage dune structure lautre. Ces oprations sont rversibles.La distance ddition entre deux squences est donc strictement quivalente au calcul dalignement de deux squences.

    On peut transposer ces oprations pour obtenir un calcul ddition entre deux arbres quelconques (et en particulier au cas des arbres reprsentant des ARNComparaison distance ddition Substitution noeud noir/jaune

    Insertion/dltion du noeud jaune

  • Ldition dabres enracins, ordonns et tiquets est pertinente pour la comparaison des ARN car elle permet de prendre en compte de manire raliste des phnomnes biologiques connus comme la perte de certaines bases (dltion), ou encore les mutations (chagement de base par une autre) mis en formalis par les substitutions.

    Nanmoins, si on en reste cette distance ddition, dautres ralits biologiques ne sont pas prises en compte, et des rapprochements non souhaits peuvent avoir lieu.Comparaison distance ddition

  • Un exemple d erreur de rapprochement. On appellera ce phnomne la dispersion.Comparaison dARN distance ddition

  • Les lacunes de cette distance dditions :Exemple 1 : Comparaison dARN distance ddition

  • Exemple 2 :Comparaison dARN distance ddition

  • 2 nouvelles oprations ddition

  • 2 nouvelles oprations ddition La fusion de noeuds

  • 2 nouvelles oprations ddition La fusion de noeudsLa fusion darcsCes deux oprations conservent bien lordre des fils (essentiel po