evrimsel perspektifte karŞilaŞtirmali...
TRANSCRIPT
Evrimsel Perspektifte Evrimsel Perspektifte KARKARŞŞILAILAŞŞTIRMALI GENOMTIRMALI GENOMİİKK
Fatih DikmenFatih Dikmen
http://cigbrowser.berkeley.edu/
CCGGGATGGGATAGCGCAAACTGCCCGGGAAGGGAAACCAGCACTGTACAGGAAGATGGCATATTTTGTTCAGGGAATGGTGAATTAAGTGTGGCAGGAATGCAGTAATTTGCTTGTATGGAATTTTGCCTGAGAGACCTCATTGCAGTTTCTGATTCATCCATCACTGTCCTTGTCAAATAGTTTGGAACAGGTATAATGATCACAA
ATAATATTTCGTTAATTCTCACAGAATCACATATAGGTGCCACAGTTATCCCCGGAGTGATGAAAACCTTAGGAATAATGAATGATTTGCGCAGGCTCACCTGGAAGTCAAATGTTGGGTCTGGTCTGACTTTAATGTTTGCTTTGTTCATGAGCACCATCCTATGCAGTTAAGCAGGTAGGTGACAGAAAAGCCCATGTTTGTCTCTACTACTGAATGTATGTATGGAGTTTCTACACCAGATTCTTCAGTGCTCTGGATATT
CCCATGACTTTATTCTGACACTACCTGGANedengenom?CCTTGTCAAATAGTTTAATAGTTTGGAGTCCTTGTCAAATAGTTTGGGGTTAGCACAGACCCCACAAG
AGTCCCACGAGGCCATCCTCACTTCAGATGACAATGGCAAGTCCTAAGTTGTCGACCAACCTGTTACCAATCGGGGGTTCCCGTAACTGTCTTCTTGGGTTTAATA
ACAGTTTACGGAACTCAGAAAAACAGTTTATTTTCTTTTTTTCTGAGAGAGAGTTGCCCAGGCTGGTGTGCAATGGTGCAGTCATAGCTCATTGCAGCCTTGATTG
AGTGGTTCTCCCACCTCAGCCTCCCTAGTAGCTGAGACTACATGCCTGCACCAAGTTTCTTTTATTTTTTGTATAGATGGGGTCTTGTTGTGTTGGCCAGGCTGGCGTCTCAAGTGATCCTCCCACCTCAGCCTCTGAAAGTGCTGGGATTACAGATG
CATCTGGCCAGTTCATTTCCTATTACTGGTTCATTGTGAAGGATACATCTCAGAGAAAGAGACGTGCATGCTGGATGCAGTGGCTCATGCCTGTAATCTCAGCACTT
http
://w
ww
.bro
okly
n.cu
ny.e
du/b
c/ah
p/LA
D/C
4/C
4_C
hrom
osom
es.h
tml
DNA ProteinŞifre
Santral DogmaSantral Dogma
İnsan Genom Projesi’nin motivasyon kaynağıbelki de bu kavrama dayanmıştır diyebiliriz
Şifrelerden birinin bilinmesi halinde diğerlerinin de “şifre çözümü” ortaya çıkar!?
İİnsan genomu nsan genomu çöçözzüülmeden lmeden öönce insanlarnce insanlarıın 100.000 n 100.000 adet gene sahip olduadet gene sahip olduğğu tahmin edilmekteydi. Genom u tahmin edilmekteydi. Genom sekanssekansıınnıın tamamlandn tamamlandığıığınnıın sn sööylendiylendiğği 2001 yi 2001 yııllıında bu nda bu tahmin 25.000'e dtahmin 25.000'e düüşşttüü. . ŞŞimdi ise toplam sayimdi ise toplam sayıınnıın n yaklayaklaşışık 22.000 olduk 22.000 olduğğunu ama her an 19.000'e bile unu ama her an 19.000'e bile ddüüşşebileceebileceğğini bilmekteyiz.ini bilmekteyiz.
İGP-İnsanlığın Kendini Araması!
KarKarşışılalaşşttıırmalrmalıı genomikgenomik ((comparativecomparative genomicsgenomics) farkl) farklııorganizmalarorganizmalarıın genomlarn genomlarıı arasarasıındaki ilindaki ilişşkiyi (farklkiyi (farklııllıık ve k ve benzerlikleri) inceleyen yeni bir bilim dalbenzerlikleri) inceleyen yeni bir bilim dalııddıır. r.
Ancak İnsan Genom Projesi, ne kendimizi ne dünyamızı anlamamızı sağlamadı. Sadece bir başlangıç yolunu açtı.
Artık biliyoruz ki saece genom dizilerini bilmek yeterli değil. Esas önemli olan bu dizilerin fonksiyonunu bilmek! İşte bu nokta “karşılaştırmalı genomik”in çıkış noktasıdır.
http://cigbrowser.berkeley.edu/
The different topics in bioinformatics are thus:The different topics in bioinformatics are thus:
Comparative GenomicsComparative GenomicsStudying similarities and differences between Studying similarities and differences between genomesgenomesFunctional GenomicsFunctional GenomicsCataloguing the activities of genes and Cataloguing the activities of genes and characterizing interactions between all gene characterizing interactions between all gene products (proteomics) products (proteomics) Analysis of Gene Expression StudiesAnalysis of Gene Expression StudiesTools and techniques to follow up the level of Tools and techniques to follow up the level of gene expression in different stages in gene expression in different stages in development or disease or in different tissuesdevelopment or disease or in different tissuesStructural GenomicsStructural GenomicsDetermining genome structureDetermining genome structureTrying to crystallize and/or predict protein Trying to crystallize and/or predict protein structurestructure
http://www.tengu.be/bioinformatics2003/
Genlerin dizisinin belirlenmesi ardGenlerin dizisinin belirlenmesi ardıından en ndan en öönemli adnemli adıım karm karşışılalaşşttıırmalrmalıı genomiktirgenomiktir!!
Peki karPeki karşışılalaşşttıırmalrmalıı genomikgenomik nasnasııl yardl yardıımcmcıı olur?olur?Temelde 2 yardTemelde 2 yardıımmıı vardvardıır:r:
aa-- SekansSekansıı bilinen dizilerde gen bulmaybilinen dizilerde gen bulmayıı kolaylakolaylaşşttıırrıır.r.bb-- Evrimsel Evrimsel ççalalışışmalar; biz kimiz???malar; biz kimiz???
www.nature.com
Sekansı Bitmiş Genomlar
Gen Bulmak!Genom dizilerinin benzerliği üzerine yapılan araştırmalar fonksiyonel gen bölgeleri belirlemede en önemli yöntemdir. Bu konudaki en iyi örnek protein kodlayıcı bölge tespitinde bu analizlerin katkılarıdır. Bunun için normalde türler arası benzerliği analiz eden yazılımlar büyük genomların analizine uyarlanmıştır. Bu sayede 2003 verilerine göre memelilerde 1000 yeni gen seti tespit edilmiştir. Nematod genomlarının kıyaslanması ile de 1275 adet iyi desteklenmiş gen bölgesi önerilmiştir. Artık günümüzde kodlanmayan RNA bölgelerinin tespiti biyoinformatik ve genomik çalışmaların en önemli hedefi olmuştur. Ayrıca şunu da belirtmeliyiz ki, kodlanan bölgeler için kullanılan türler arasındaki benzerliği analiz eden programlar bu yeni hedef için de umut vaat etmektedir.
Evrimsel AnalizKarşılaştırmalı genomik ile yapılabilecek en basit değerlendirmelerden biri genomlar arası uyumun analizidir. Genomların karşılaştırılması işleminde organizmaların filogenetikmesafeler çok önemlidir. Eğer geniş ölçekli değerlendirmeler yapılacaksa uzak filogenetikilişkide bulunan canlıların genomlarının kıyaslanması daha doğru olur. Mesela Rubin et. al (2000)’a göre maya, solucanlar ve sineklerin genomlarının kıyaslandığı çalışmada ökaryotik proteinlerin çoğu ortak olarak bulunurken filogenetik olarak daha yakın akraba olasinek ve solucanların bazı temel proteinleri (sinyal yolu proteinleri), mayalara göre iki kat daha fazla taşıdıklarıbulunmuştur.
ACCATGAAAGACTTGTGAATCCAGGAAGAGAGACTGACTATGTTATTCAGATGCATCAGGTGCAATGGGAAGCTCTTCTTCCAGTTAAGGTGACATTGAAGCCAAGTCCTGAAAGAT
AGT’Nothinginbiologymakessenseexceptinthelightofevolution’GGAGGGGGAGGTGGAGGGATGGGGAATGGGCCGGGATGGGA
AACTGCCCGGGAAGGGAAACCAGCACTGTACAGACCTGAAGATGGCATATTTTGTTCAGGGAATGGTGAATTAAGTGTATGCGTATheodosiusDobzhanskyGACACAGTAATTTGCTTGTTTGCCTGAGATTGCCTCTCCTATGCAGTTAAGCAGGTAGG
AAAAGCCCATGTTTGTCTCTACTCACACGACACCAGATTCTCTGGATATTAACTGTCCCATEvolutionaryGenomicsGGCTTGTTTCCGGACCTTGTCAAATAGTTTGGAGTCCTTGTCAAAGGTTAGCACAGACCCCACAAGTTAGGGGCTCAGTCCCACCCTCACTTCAGATGACAATGGCAAGTCCTAAGTTGTCACTGACCAACCTGTTACCAATCGGGGGTTCCCGTAACTGTCT
Ancak 70-100 milyon yıllık bir zaman dilimleri içinde birbirinden ayrılan organizmalarla çalıştığınızda hem fonksiyonel hem de fonksiyonsuz DNA’ların korunabildiğini görebilirsiniz. Bu tür vakalarda fonksiyonel DNA sekanslarının durulaşma ve negatif seleksiyon izleri gösterir ki bu da, fonksiyonel DNA’nın fonksiyonsuz veya nötralDNA’dan daha az değişeceğinden kaynaklanır (??)
Veri tabanları ve Biyoinformatik
Farklı DNA dizilerinin hizalanması (alingment) karşılaştırmalı genomikçalışmalarındaki ana işlemdir.Hizalama işlemi, bir dizideki nükleotid ile diğer dizideki nükleotidin çakıştırılarak iki dizi arasındaki uyumlu (matching) alanların belirlenmesidir. Bu yüzden en iyi şekilde hizalama yapılmalıdır ki ona göre en iyi uyumluluk sonuçları alınabilsin.Sadece iyi hizalama yapmak ya da iyi uyumluluk elde etmek yeterli olmaz. Çıkan verilerin analiz edilmesi de gereklidir. Miyarlarca baz dizisi verisini düşündüğünüzde bunları berim bilim yardımı olmadan çözmeniz olanaksızdır. BLAST, FASTA ve onların türevleri gibi arama algoritmaları yeni sekansların daha önce depolanmış tüm sekanslarla karşılaştırılmasına izin verir.
Nothing in (computational) biology makessense except in the light of evolution
after Theodosius Dobzhansky (1970)
Bir Biyoenformatik Takımı
Hacking the Genome
ProteinProtein ProteomicsProteomics((ilailaçç sanayisisanayisi))
RNARNA TranscriptomicsTranscriptomics(micro(micro--array/DNA array/DNA ççipiipi))
DNADNA GenomicsGenomics((SekansSekans))
Veri tabanVeri taban ıı
Collect nucleic acid and amino acid sequences, most important Collect nucleic acid and amino acid sequences, most important examples:examples:
European Molecular Biology Laboratory (EMBL)European Molecular Biology Laboratory (EMBL)Nucleotide Sequence DatabaseNucleotide Sequence DatabaseSWISSSWISS--PROTPROTAnnotated (Annotated (curatedcurated) protein sequence database) protein sequence databaseGENBANK (NCBI GENBANK (NCBI –– National Center for Biotechnology Information)National Center for Biotechnology Information)Nucleic acid and protein sequencesNucleic acid and protein sequences
http://www.tengu.be/bioinformatics20
http://cgg.ebi.ac.uk/services/cogent/
243 organizma genomu!
http://www.http://www.ebiebi..acac..ukuk//genomesgenomes//eukaryotaeukaryota.html.html
51467
42
1158 379
504
1321
Karşlaştırmalı Genomik Bize Neler Öğretti
İnsan ile şempanze arasında gen farkı %1’den azGoriller veya Orangutanlarla %3’den azİnsan yüzlerce atasal (3,5 milyar yıllık) gen taşımakta. Mesela bakterilerle ortak 500 geni var.Drosophila ile ortak 1500 geni var.%80 genleri fare ile ortak…. vs vs
Primat atalarımızdan çok uzak olmadığımız kesin
m ve Teknik, Nisan 2004
Deniz Cansaş
Bilim ve Teknik, Ekim 2005
Bilim ve Teknik, Ocak 2005
İnsanda protein kodlayan genlerin hemen hemen tümünü hizalandığında fare ile %99 homoloji ve %80 1:1ortholog’luk göstermektedir. Çoğu durumda intron-exon yapıları oldukça korunmuştur. Fare ile insan biyokimyası arasındaki benzerlik ve uyum düşünüldüğünde protein kodlayan bölgenin bu olağanüstü korunumu belki beklenebilir bir durumdur
Rhesus makakları Macaca mulatta, insan ve şempanzelerden sonra, tüm genom dizisi çıkarılan üçüncü primat türüdürYapılan incelemeler, makak-insan genomlarının protein kodlayıcı dizi bakımından %97,5 aynı olduklarını ortaya çıkardı. Makaklarda, insanlarda ve şempanzelerde aynı olan 108 gen ailesinin farklı şekilde evrimleştikleri anlaşılmış oldu.Makaklar bağışıklık sistemi araştırmalarında sıkça kullanılan model organizmalardan biri olduklarından, bu bilgi araştırmacılar için son derece önemlidir
Caenorhabditis briggsae ve C. elegans genomlarının protein kodlayan bölgeleri arasında yapılan analiz %60 homolojiyigöstermiştir. Bu iki nematod arasında morfolojik fark bulmak çok zordur. Muhtemeldir ki gelişim basamakları da aynıdır. Ancak bu iki benzer nematodun bu kadar farklılık göstermesi bize bunların benzer fenotipleri farklı genetik yollarla sağladıklarını düşündürmektedir. Bu konuda yapılacak detaylıbenzerlik/farklılık analizler belki de gelişim biyolojisi konusunda çok yeni ufuklar açabilecektir
Hox Gen KompleksiHox Gen Kompleksi
Tüm bu yorumların daha doğru yapılabilmesi başka türlerinde bu analizlere eklenmesi ve tekrarsız dizileri ve hizalanmayan genomlarıiçeren kapsamlı açıklamaların yapılabilmesi ile mümkündür. Ayrıca sadece evrimleşme hızının değişebilirliği değil, genomların da epeyce varyasyona açık olduğunun göz önünde tutulması gerekmektedir. Özellikle memeli kromozomlarının nükleotid değişimine, transpozon eklenmelerine ve rekombinasyonlara açık olması, primat genomunda segmental duplikasyonlarındeğişikliklerin temel kaynağı olduğunun bilinmesi ve ona göre analizlerin gözden geçirilmesi gerekmektedir
Doolittle, Science 1999
Asgari Genom
Mycoplasma genitaliumHaemophilus influenzaeBacillus subtilis
E. coli
H.influenzae M.genitalium
1,146
1,129
88918
10
239
1
Yanai and Lancet, 2004;
Tanrı’yı Oynamak – Life 2.0
Yeni proteinlerin keşfiEvrimsel genomikNişasta kullanarak bir hücre yaratmak!Yakıt üreten hücreler