evolução de genes e genomas -...
TRANSCRIPT
11/05/2012
1
Evolução de genes e genomas
Professor Fabrício R Santos [email protected]
Departamento de Biologia Geral, UFMG 2012
Projeto Genoma Humano iniciou em 1990
Vários genomas de procariotos e eucariotos foram concluídos antes do genoma humano
Organização, função e complexidade genômica
Tamanhos de genomas completos Genomas cromossomos (N) tamanho genes
Mycoplasma genitalium 0,58 Mpb 521
Escherichia coli 5,4 Mpb 5.416
Saccharomyces cerevisiae 16 12,5 Mpb 5.770
Caenorhabditis elegans 6 ~100 Mpb 19.427
Arabidopsis thaliana 5 ~115 Mpb ~28.000
Drosophila melanogaster 5 ~122 Mpb 13.379
Homo sapiens 24 ~ 3,3 Gpb ~22.500
Monodelphis domestica 10 ~3,5 Gpb ~20.000
Complexidade genômica
A organização e as proporções genômicas de regiões codificadoras de proteínas, não codificadoras (com ou sem função) e repetitivas são diferentes entre táxons.
11/05/2012
2
Distribuição de genes no Homo sapiens
Saccone et al. (2001) Chromosome Res.
A densidade de genes varia muito ao longo dos cromossomos humanos
Grande parte dos genes eucarióticos não tem função conhecida (unknown)
Genomas eucarióticos comparados
Sequências codificadoras
e não codificadoras
~70-75%
> 150 MAA
4,2
Gambá
0,4 2,5 3,0 Tamanho (Gpb)
~65% ~80% >99% Conservação em
regiões codificadoras
Sequências codificadoras
Sequências codificadoras e
não codificadoras
Mudanças genômicas e/ou
adaptativas exclusivamente
humanas
Permite identificar:
~450 MAA > 75 MAA ~5-7 MAA Tempo desde a
divergência
Baiacu Camundongo Chimpanzé Homem vs..
Genomas eucarióticos comparados
Usando a teoria evolutiva, os genomas são comparados a fim de caracterizar mudanças que ocorrem nos ancestrais comuns (sinapomorfias) e também mudanças exclusivas (autapomorfias) das espécies.
sinapomorfias
autapomorfias
Sintenia Homem-Baiacu Regiões cromossômicas com extensa homologia e mesmo ordenamento gênico (sintênicas) podem ser mapeadas entre espécies.
Regiões cromossômicas com extensa homologia e mesmo ordenamento gênico (sintênicas) podem ser mapeadas entre espécies.
Cromossomo humano 1 vs. Chimpanzé
12
Genômica Comparativa – Sintenia
Homo sapiens
Divergência 6 MAA
11/05/2012
3
13
Cromossomo humano 1 vs. Camundongo
Genômica Comparativa – Sintenia
Homo sapiens
Divergência >75 MAA
14
Genômica Comparativa – Sintenia
Cromossomo humano 1 vs. Vaca
Homo sapiens
Divergência >95 MAA
15
Genômica Comparativa – Sintenia
Cromossomo humano 1 vs. Gambá
Homo sapiens Divergência >150 MAA
16
Genômica Comparativa – Sintenia
Cromossomo humano 1 vs. Ornitorrinco
Homo sapiens Divergência >180 MAA
17
Genômica Comparativa – Sintenia
Cromossomo humano 1 vs. Galinha
Homo sapiens Divergência >200 MAA
DNA “entulho”
Antes do sequenciamento de vários genomas eucarióticos, grande parte da porção não codificadora era chamada de DNA “entulho” (junk DNA), que por alguns foi traduzida equivocadamente como DNA “lixo”. Atualmente, várias porções deste DNA “entulho” possuem funções estruturais ou regulatórias:
1. RNAs funcionais: miRNA, snRNA, snoRNA, RNA anti-senso etc 2. Regiões conservadas não codificadoras: enhancers, reguladores diversos etc
No entanto, a maior parte do DNA “entulho” corresponde a segmentos repetitivos, principalmente os elementos transponíveis:
1. LINEs (elementos retrotransponíveis ou retroposons – via RNA - longos) 2. SINEs (retroposons curtos) 3. ERV (retrovírus endógenos) 4. Transposons (elementos transponíveis via DNA)
11/05/2012
4
miRNA e RNA anti-senso estão subestimados Obs: outros RNAs não codificadores funcionais raros não estão representados
RNAs funcionais que emergiram da genômica evolutiva
miRNA
Micro RNA (miRNA) Família de pequenos RNAs de 21–25 nucleotídeos que regulam negativamente a expressão gênica no nível pós-transcricional.
O complexo de silenciamento induzido por RNA (RISC) é operado por
miRNA (junto com proteínas argonautas)
Enhancer HACNS1 descoberto por genômica comparada está relacionado ao desenvolvimento
Expresso exclusivamente nos membros anteriores e posteriores durante o desenvolvimento na espécie humana, seus ortólogos de chimpanzé e rhesus não se expressam da mesma forma nos fetos transgênicos de camundongos.
HAR1F: região não codificadora altamente conservada que expressa um RNA funcional
A alta conservação desta sequência transcrita foi detectada por genômica comparada entre inúmeras espécies de vertebrados, indicando que é mantida por seleção purificadora, pois possui uma função importante, embora ainda não seja conhecida.
Elementos transponíveis em eucariotos Retrotransposons e transposons constituem quase metade do genoma humano
Os elementos transponíveis representam várias classes que se multiplicam e se mobilizam nos genomas eucarióticos e procarióticos. Esses elementos não codificam normalmente funções do organismo hospedeiro e podem ser considerados como unidades evolutivas relativamente independentes, algumas vezes vistos como comensais, mas outras vezes são vistos como mutualistas ou parasitas moleculares.
11/05/2012
5
Proporção de elementos transponíveis em genomas eucarióticos
Muitas diferenças de tamanhos dos genomas entre espécies se devem, principalmente, ao acúmulo de elementos transponíveis.
Arabidopsis thaliana Psilotum nudum
~115 Mpb
~ 250 Gpb
Tamanhos de genomas completos
Por que alguns genomas são tão grandes?
Não há uma relação clara entre tamanho de genomas e “complexidade biológica”.
• Valor-C – quantidade total de DNA no genoma haplóide (N)
• Paradoxo do valor-C – falta de relação entre o conteúdo de DNA em um organismo e seu potencial codificador e complexidade.
Valor-C (escala logarítmica)
Elementos repetitivos, geralmente transposons etc
Paisagens genômicas contrastadas
A quantidade de elementos transponíveis está positivamente correlacionada com o tamanho genômico
DNA genômico
Elementos transponíveis
DNA codificador de proteínas
Feschotte e Pritham 2006
09_26_noncoding.jpg Sequências repetitivas e de cópia única no genoma humano
11/05/2012
6
Elementos transponíveis em humanos
Retrotransposon longo
Retrovírus endógeno
Transposon típico
Retrotransposon curto
Transposons versus Retrotransposons (ou retroposons)
Retrotransposons autônomos 1. Retrovírus endógenos: retrotransposons com LTR (long terminal
repeats) (vírus inserido no genoma, sem atividade infectiva)
2. Retrotransposons sem LTR (possuem poli-A)
Retrotransposons eucarióticos autônomos têm a sua própria transcriptase reversa
Retrovírus endógenos (ERV) são similares a retrovírus, apresentando as mesmas estruturas gênicas e ciclo de propagação parecido, mas não formam partículas infectantes
ERVs são retrotransposons com LTRs, repetições típicas de Retrovírus.
Transcriptase Reversa
LINEs e SINEs em metazoários uma longa história coevolutiva
Os LINEs, como o elemento L1 de primatas, são autônomos, i.e., codificam sua própria enzima de replicação (RT), que é utilizada na replicação de SINEs (como ALU de primatas) e pseudogenes processados. A presença de um Poli-A é a marca típica da retrotransposição mediada pelas RTs dos LINEs.
LINE – Sequência repetitiva intercalada longa
SINE – Sequência repetitiva intercalada curta
11/05/2012
7
Retrotransposon do tipo LINE
ORF1: proteína de ligação ao RNA
ORF2: (RT) endonuclease + transcriptase reversa
Estes elementos têm capacidade autônoma de retrotransposição
Slide 38
Retrotransposição mediada por LINEs
Propagação de LINEs e SINEs nos genomas eucarióticos
Geralmente, os LINEs providenciam a enzima transcriptase reversa que é utilizada por eles e pelos SINEs para sua retrotransposição e aumento de cópias no genoma hospedeiro.
Inserção de LINEs e SINEs nos genomas
Evolução dos elementos ALU em Primatas
• Os retroposons ALUs são derivados do RNA ribossômico 7SL.
• Os transcritos de ALU também se ligam a proteínas ribossômicas.
• As ALUs se associam aos ribossomos, próximo ao sítio de síntese.
• Quando um RNAm de L1 (LINE) está sintetizando sua RT com afinidade por caudas poli-A, está se liga à cauda do elemento ALU.
• Este complexo ALU + RT se dirige ao núcleo, onde se dará a retrotransposição que resulta em nova cópia inserida de ALU.
• A RT pode também se ligar eventualmente à poli-A de outros RNAm, dando origem aos pseudogenes processados.
Componentes estruturais e funcionais do genoma humano
11/05/2012
8
Transposons no cromossomo 21 humano
A maior parte das inserções de elementos transponíveis nos genomas é observada em regiões não codificadoras ou sem importância funcional
No genoma humano, a densidade das classes de repetições intercaladas varia como uma função do conteúdo de GC
IHGSC. Nature (2001) 409 860-921
L1s (LINEs) são comuns em regiões pobres em GC, enquanto ALUs (SINEs) são comuns nas GC-ricas
Inferência filogenética com o uso de SINEs e LINEs
A inserção de um elemento transponível é geralmente um evento único de mutação neutra, e vários destes eventos acumulam ao longo das linhagens evolutivas, podendo ser utilizados como caracteres sinapomórficos em cladística.
Inferência filogenética com o uso de SINEs e LINEs
espécie A espécie B espécie C espécie D
Elementos ALU e filogenia de Hominóides
PNAS (2003) 22:12787-91
Expansão dos elementos Alu na linhagem primata
Mark A. Batzer e Prescott L.Deininger
11/05/2012
9
Alterações mediadas por retroelementos
Mutagênese insercional
Recombinação desigual mediada por ALUs
Promotor
Rompe a matriz de
leitura
Danifica o processamento de
íntrons
Não altera Altera expressão do gene
Inserções de elementos transponíveis
Transposons e retrotransposons podem afetar o funcionamento gênico quando inseridos próximos ou dentro dos genes
Inserção de um elemento L1 (LINE humano) interrompeu porção codificadora do éxon 14 do gene do fator VIII é a causa molecular de um tipo de hemofilia A.
Locus Ocorrência Tipo de Alu Doença BRCA2 de novo Y Câncer de mama
Mlvi-2 de novo (somática?) Ya5 Associado com leucemia
NF1 de novo Ya5 Neurofibromatose
APC Familiar Yb8 Doença desmóide hereditária
PROGINS ~ 50% Ya5 Ligada com carcinoma de ovário
Btk Familiar Y X-linked agammaglobulinaemia
IL2RG Familiar Ya5 XSCID
Colinesterase Uma família Japonesa Yb8 Deficiência de colinesterase
CaR Familiar Ya4 Hipercalcemia hipocalciúrica e hiperparatireoidismo neonatal
Inibidor C1 de novo Y Deficiência do complemento
ACE ~ 50% Ya5 Ligada com proteção de doenças cardíacas
Fator IX Um avô Ya5 Hemofilia
2 x FGFR2 de novo Ya5 Síndrome de Apert
GK ? Sx Deficiência de Glicerol Quinase
Alguns raros eventos de inserção, quando inseridos nas porções funcionais do genoma (regiões regulatórias, éxons, íntrons etc) podem levar a efeitos deletérios.
Inserções de ALU e doenças genéticas
Importância evolutiva do DNA “entulho”
Sincitina (Syncytin - poliproteína env de um retrovírus endógeno com função no sinciciotrofoblasto) Blond JL (1999): Molecular characterization and placental expression of HERV-W, a new
human endogenous retrovirus family". J Virol
Regulação da expressão gênica e promoção de diversidade genética Peaston A et al (2004): Retrotransposons Regulate Host Genes in Mouse Oocytes and
Preimplantation Embryos. Developmental Cell
Evolução de novos genes, p.ex., uma proteína anticongelamento de peixes polares DeVries AL e Cheng C-HC (2005): Antifreeze proteins in polar fishes. Fish Physiology
Capacidade de reparo de fitas quebradas mediada por LINE-1. Morrish TA et al (2002): DNA repair mediated by endonuclease-independent LINE-1
retrotransposition. Nature Genetics
Fontes de microRNAs Woolfe A et al (2005): Highly conserved non-coding sequences are associated with vertebrate
development .PLoS Biol
Sincitina e a formação do sinciciotrofoblasto da Placenta
Esta poliproteína (env) de origem viral modificada é essencial para formação da placenta em mamíferos eutérios. De fato, retrovírus endógenos (ERV) são ativos em todas as placentas de eutérios.
Eventos de duplicação genômica detectados
Duplicação de genomas: poliploidização
Van de Peer et al. Nature Reviews Genetics (2009)
11/05/2012
10
Duplicação gênica
A maioria das famílias gênicas geradas por duplicação são pequenas, com exceção daquelas que possuem uma base adaptativa, por exemplo, genes de imunoglobulinas (1000 cópias em humanos), receptores olfatórios (centenas de cópias em mamíferos)
• A maior parte do genoma aparece em pares (não como triplicatas etc) • Além disto, há evidências de que mais de 60–70% das angiospermas possuem um
ancestral poliplóide em algum momento, resultado de duplicação genômica.
Arabidopsis Genome Initiative. Nature 408, 796–815 (2000)
Duplicação de segmentos genômicos em Arabidopsis thaliana
Homólogos: ortólogos e parálogos
Ortólogos: genes em organismos diferentes que divergiram a partir do gene no ancestral comum por causa da especiação a1 – a2 ou b1 – b2 Parálogos: genes que derivados de um gene ancestral via duplicação gênica a1 – b1 ou a1 – b2, etc…
Homólogos: genes que têm um mesmo ancestral...
Recombinação gerando duplicação gênica
Elementos repetidos intercalados funcionam como regiões portáteis de homologia que promovem o crossing-over desigual
(SINEs, LINEs, transposons etc)
59
Retroposons (e transposons) geram diversidade Recombinação promove embaralhamento de éxons
Elementos repetidos intercalados nos íntrons funcionam como regiões portáteis de homologia que promovem o crossing-over desigual que gera duplicação ou novas combinações de éxons.
11/05/2012
11
Diversidade gênica e retrotransposons
Embaralhamento de éxons via mobilização de SINEs
éxon 1 SINE
íntron
éxon 2
Transcrito SINE + éxon SINE éxon 2
A transcrição do SINE (ou LINE) pode se estender além do sinal de parada normal, incluindo um éxon. A inserção do elemento SINE por retrotransposição pode levar o éxon para dentro de outro gene e permitir um novo embaralhamento e produzir um “novo gene”.
éxon 4 SINE éxon 2 éxon 5 éxon 6
Elemento inserido
inserção por retrotransposição
Quimerismo gênico
Genes quiméricos se originam via embaralhamento de éxons e/ou retrotransposição
Na retrotransposição, mRNA é transcrito a cDNA que é então inserido no gene (sem íntrons).
Ambos genes Jingwei e Ymp são expressos em testículos de Drosophila.
No entanto, Retrotransposição frequentemente resulta em pseudogenes que não são funcionais.
Embaralhamento de éxons e novidades evolutivas
Várias novidades evolutivas aparecem no nível genômico por eventos de embaralhamento de éxons e duplicação gênica. Alguns genes apresentam funções novas oriundas da combinação de diferentes éxons.
Família das globulinas Produtos gênicos resultados de duplicação e embaralhamento de éxons
AFGP parece ser derivada (via multiplicação de motivos e perda de éxons) a partir do gene Tripsinogênio. Foi encontrada uma versão quimérica em alguns peixes, uma forma transicional.
Notothenioides
Proteína anticongelante (AFGP) Transposons promovem diversidade genômica
Vários genomas apresentam uma grande diversidade estrutural e flexibilidade recombinacional devido à presença de elementos repetitivos do tipo transposons (via DNA e RNA). Estas características são também úteis no melhoramento genético convencional e na transgenia em cereais, com genomas ricos em transposons.
11/05/2012
12
Genômica comparativa e biotecnologia
Um nova área biotecnológica está emergindo da genômica comparativa:
A genômica sintética 1. conhecer as funções mínimas e essenciais que podem ter um genoma
depende de compreender as relações de ancestralidade entre espécies ou linhagens.
2. genomas artificiais com requisitos funcionais mínimos foram inferidos das comparações filogenéticas.
3. genes também foram comparados filogeneticamente para, em alguns casos, reconhecer funções compartilhadas com ancestrais e também sintetizar genes com funções simplificadas ou consensuais.
4. nestas abordagens, os genomas são vistos como os programas (software) que permitem controlar todas funções.
5. desta forma, funções extras podem ser acopladas ao genoma mínimo artificial.
Genomas Sintéticos
• Mycoplasma laboratorium Organismo parcialmente sintético e derivado da espécie Mycoplasma genitalium – Gibson D, et al. (2008): Complete Chemical Synthesis, Assembly, and Cloning
of a Mycoplasma genitalium Genome. Science.
• Synthia Organismo bacteriano totalmente sintético derivado do genoma de Mycoplasma mycoides que foi transplantado em uma célula de Mycoplasma capricolum – Gibson D, et al. (2010): Creation of a bacterial cell controlled by a chemically
synthesized genome. Science.
Informação no DNA funciona com um software para geração de organismos sintéticos
O genoma humano apresenta uma estrutura típica de vertebrados, sem apresentar qualquer gene exclusivo de nossa linhagem que possa ser considerado como uma novidade evolutiva. Em 2001, 1% dos genes não eram conhecidos em qualquer outro organismo, mas posteriormente foram todos encontrados no chimpanzé e em outros organismos cujos genomas já foram sequenciados.
Dados do Projeto Genoma Humano em 2001
Homologia dos genes humanos Genômica comparada em Primatas
Os genomas de vários primatas estão fase adiantada de andamento e alguns já concluídos
11/05/2012
13
Eventos de duplicação, inversão e translocação de segmentos cromossômicos, incluindo fusões e fissões de cromossomos inteiros, são promovidos por elementos repetitivos tais como transposons e retroposons. A evolução cromossômica está intimamente relacionada a vários eventos de especiação nos primatas e em vários outros grupos taxonômicos.
Genômica comparada e estudos demográficos
Dados genômicos entre espécies são utilizados em cálculos mais precisos dos tamanhos populacionais efetivos das espécies
Genomas extintos
Novas tecnologias estão permitindo recuperar sequências genômicas de organismos extintos
Genomas extintos: Neandertal
A comparação dos genomas utilizando a teoria evolutiva permite a identificação de várias modificações protéicas diferenciais entre as linhagens do homem moderno e do neandertal, as quais podem identificar possíveis adaptações exclusivas de cada espécie.
Genomas extintos: Neandertal
Homens modernos e Neandertais coexistiram na Europa pelo menos 15.000 anos (entre 45 e 30 mil anos atrás), mas não há indícios de fluxo gênico ali. No entanto, algum fluxo gênico (1 a 4%) entre as duas linhagens pode ter ocorrido há ~100.000 anos no Oriente Médio.