Biyokimya/Biyoinformatik

Vikikitap, özgür kütüphane
Gezinti kısmına atla Arama kısmına atla

Biyoinformatik Nedir?[değiştir]

Biyoinformatik, moleküler biyolojiyi analiz etmek için bilgisayar teknolojisinin avantajını kullanan, hızla gelişen bir bilim alanıdır. Biyoinformatik alanındaki yöntem istatistik, dil bilimi, matematik, kimya, biyokimya ve fizikten türetilebilir. Nükleik asitlerin veya peptid zincirinin sekansı veya yapısal verileri ile deneysel veriler, biyoinformatik alanındaki bilim adamları tarafından veri olarak kullanılabilir [1]. Spesifik olarak, biyoinformatiği içeren alan yapısal biyokimyası, dizi dizilimlerinin nasıl elde edildiğini ve sonunda dizilerin analizinin filogenetik ağaçlar üretmeye nasıl yardımcı olabileceğini ele almaktadır. Bu ilişkiler nihayetinde makromoleküllerin yapılarının nasıl ortaya çıktığı ve birbirleriyle karşılaştırıldığı hakkında bilgi sağlamaya yardımcı olabilir.

Protein Veri Bankasının Özellikleri[değiştir]

Makromoleküllerin en iyi bilinen yapılarından bazıları atomik koordinatlar olarak arşivlenir. Bunlar atomik koordinatlar moleküler yapıların üç boyutlu yapısını içeren veri dosyalarıdır. Atomik koordinatların bağlantısı ayrıca bu veri dosyalarının özelliklerini açıklar. Bir dizi moleküler yapı Protein Data Bank (PDB)' de depo edilir. PDB'nin bağlantısı, halka açık olarak verilen birçok koordinatı bulmak için kullanılan URL'dir. Makromoleküler yapılar üzerine sonuçlar yayınlayan birçok bilimsel dergi, artık araştırmacıların atomik koordinatları veritabanına yüklemelerini gerektirmektedir. Sonuç olarak, bu bankada proteinleri, nükleik asitleri ve karbonshidratları içeren neredeyse 20.000'den fazla makromoleküler yapı vardır. X-ışını kristalografisi, kırınım teknikleri, nükleer manyetik rezonans (NMR), elektron mikroskobu ve teorik modeller. Bu bankaya her yıl yaklaşık 2500 yeni yapı sunulduğundan, büyümektedir.

Bir yapı belirlenirken, makromoleküler yapı ile ilişkili dört karakterli bir tanımlayıcı Protein Veri Bankası kimlik kodu (Protein Data Bank identification code-PDBid) kullanılır. İlk karakter bir ile dokuz arasında bir rakam olmalıdır, kalan üç karakter büyük veya küçük harf olabilir. Örneğin, miyoglobin yapısı PDB'de 1MBO olarak kodlanmıştır. Bununla birlikte, tanımlayıcıların mutlaka makromolekülün adıyla bir ilişki kurması gerekmediğine dikkat etmek önemlidir.

İlk olarak, atom koordinat dosyası, incelenen molekülün kimliği ve özellikleri, dergi referansları, dosyanın gönderildiği tarih, makromolekülün elde edildiği organizma ve yapıyı beraberinde getiren yazar(lar) gibi bilgilerle başlar. Ayrıca, dosya yapının nasıl belirlendiğinin ve simetri ile araştırılmayan birimlerin bir tanımını içerir. Birçok zincirin sekansı, birbirleriyle heterogen grupları (HET) olarak adlandırılan bir açıklama ve formüllerle birlikte sunulur. HET, hem grubu organik moleküller gibi standart amino asit veya nükleotitler gibi olmayan moleküller, Hyp, diğer moleküllere bağlı metal iyonları ve su moleküllerini içerir. Bu dosya, mevcut herhangi bir disülfür bağı ile birlikte ikincil yapının elemanlarını da sağlamayabilir. PDB dosyasının çoğunluğu iki seri içerir - ATOM olarak da bilinen standart birimler ve HETATM kayıt çizgileri olarak bilinen heterojenler. Bu serilerin her biri, ATOM ve HETATM, yapıdaki belirli bir atom için seri numarasına karşılık gelen koordinatlar sağlar. Serinin ardından, atomların kartezyen koordinatları (X, Y, Z), atom uzayının kapladığı alanların oranına göre sunulmaktadır. Ek olarak, izotropik bir sıcaklık tarif edilir, çünkü atomun termal hareketliliğini gösterebilir. Daha büyük miktarda izotropik sıcaklık, daha fazla hareket olduğu anlamına gelir. Yapı NMR yoluyla tespit edilirse, PDB, yapıyı bulmak için hesaplanan bir koordinat kümesinde en temsilci üye için ATOM ve HETATM serilerini içerecektir. Son olarak, PDB dosyası hidrojen bağları ve disülfit bağları gibi atomlar arasında standart olmayan varlıklar sunan bağlantı kayıtlarıyla (CONECT) sona erer.

Nükleik Asit Veritabanının Özellikleri[değiştir]

Protein Veri Bankası'na benzer şekilde Nükleik Asit Veri Tabanı (Nucleic Acid Database-NDB), nükleik asitlerin atomik koordinatlarını içerir. NDB linki veri tabanının direkt URL adresidir. Nükleik asitleri içeren dosyanın formatı PDB dosyalarının formatı gibidir. Ancak, NDB, nükleik asitlere özgü arama için zıt bir organizasyon ve algoritmalara sahiptir. Bu özellik özellikle önemlidir çünkü proteinler miyoglobin gibi isimlerle sınıflandırılırken, nükleik asitlerin kimlikleri dizilimleri ile tanımlanır.

Makromoleküler Yapıları Üç Boyutta Görüntüleme[değiştir]

Üç boyutlu yapının incelenmesi, bir makromolekülün fonksiyonlarıyla birlikte aktif bölgelere dair çok fazla bilgi sağladığı için nispeten önemlidir. Bir makromolekülün yapısını araştırmanın en açık yolu moleküler grafik programları kullanmaktır. Yararlı bir program olan PyMOL kullanılabilir. Link, PyMOL 'ün web sitesi ve üç boyutlu bir yapıyı görüntüleme yeteneklerini göstermektedir. PyMOL gibi programlar, kullanıcının, molekülü döndürerek ve molekülün iki boyutta görmekten ziyade moleküler anlayışı artırabilen bir izlenim elde ederek aktif olarak moleküler bir yapıya girmesine izin verir. PyMOL, RasMol gibi diğer birçok popüler programla birlikte, daha fazla görselleştirme için girdi olarak PDB dosyalarını kullanır.

Yapısal Sınıflandırma ve Karşılaştırma[değiştir]

Keşfedilen birçok protein yapısal olarak diğer proteinlerle ilişkilidir. Bu benzerlik, protein dizileri yerine protein yapılarını korumuş olan evrime bağlıdır. Aşağıdaki açıklama kümesi, protein yapılarını sınıflandırmak ve karşılaştırmak için hesaplama araçlarına sahip topluluğa yönelik pek çok web sitesinden bazılarıdır. Bu araçlar kullanarak, sıra karşılaştırmalarında normalde gösterilmeyen işlevler, uzak evrimsel ilişkiler, yapıların kestirilmesi için özel katlamaların özel kütüphanelerinin oluşturulması ve bazı yapıların neden birbirinden daha baskın olduğunu açıklanabilir.

Sınıf, Mimari, Topoloji ve Homolog süper aile (Class, Architecture, Topology and Homologous superfamily-CATH), dört konuyu kullanarak proteinleri kendi yapısal hiyerarşilerinde sınıflandırır. Birincisi, "Sınıf" en üst seviyedir ve dört ikincil yapı kategorisine sahiptir. Bunlar: Başlıca alfa, Başlıca beta, alfa / beta ve sırasıyla çok fazla ikincil yapıda olmayanlar. İkincisi, "Mimari", ikincil yapının topolojiden ayrı bir düzenlemesidir. Üçüncüsü, "Topoloji", proteinlerin bağlanabilirliği ve şeklinin bütünsel görüşünü ifade eder. Dördüncü olarak, "Homolog süper aile", seçilen proteine ​​homolog olan proteinlerdir. Ayrıca, proteinin etkileşimli veya hareketsiz bir görüntüsü gösterilebilir. Miyogolobin için bir CATH örneği Sınıf olacaktır: Esas olarak alfa; Mimari: ortogonal demet; Topoloji: globin benzeri; Homolog süper aile: globin. Sonuç olarak CATH, birçok yapısal hiyerarşinin karşılaştırmasını yapmak için veritabanına erişen kullanıcıların yukarı ve aşağı göz atmalarına izin verir.

Biyoinformatiğin avantajı nedir?[değiştir]

1. Bir biyolojik veritabanı e-kütüphanesi oluşturun[değiştir]

Biyolojik veri tabanı elektriksel olarak depolanan ve yeniden canlandırılabilen organize biyolojik bilgidir. Örneğin, biyolojik bir veri tabanı adresinden izole edildiği organizmanın bilimsel adı adı, giriş sırası, adı olan bir nükleik asit dizisinin bir kaydı olabilir [2].
Bu bilgi işlem çağında, depolama veritabanı bilim insanları arasındaki iletişimi güçlendirir. E-kütüphanedeki veriler, bilim insanlarından, öğrencilere veya meslekten olmayan kişilere kadar birçok kişi tarafından yaygın olarak kullanılabilir.

2. Moleküler biyoloji ile etkileşimde yeni yöntemler[değiştir]

Moleküler biyolojiyi analiz etmek, biyoinformatikteki ana alanlardan biri olan, biyoinformatik araştırmaları yeni araçlar yaratmaya, protein dizileri gibi malzemelerin depolanması, geri alınması ve analiz edilmesine yönelik yöntemler üzerine odaklanmaktadır.
Hedef örnekleri analiz etme yöntemleri genellikle araştırmacıların ilginç örneklem yapısını belirlemelerine yardımcı olacak ya da bilim adamlarının depolama verilerinden örnek için aile grubunu belirlemesine yardımcı olacak bilgisayar programlarıdır. Biyoinformatikte kullanılan yaygın bir program BLAST(Basic Local Alignment Search Tool), Temel Yerel Hizalama Arama Aracı' dır. BLAST araştırmasının sonucu, araştırmacıların, bilinen dizilerin veritabanından örnek dizinin homolog dizilerini tanımlamasına yardımcı olacak bir dizi dizilimi listesidir [3].

3. Evrimi keşfedin[değiştir]

Ortak bir ataya sahip olan proteinlerin, amino asit dizileri birbirine benzeyecektir. Bu nedenle, dizilim ve yapısal veriler hakkında bilgi sahibi olan bilim adamları, bilinmeyen bir proteini gruplar halinde düzenleyebilir ve proteinin evrimini yeniden yapılandırabilir. Dizi hizalama yöntemi, homolog genleri veya proteinleri tespit etmek için bir tekniktir. İki genin veya proteinin evrim ilişkisi, skor matris veya ikame matrisi ile hesaplanarak belirlenir. Proteinlerin üçüncül yapısını karşılaştıran yapısal hizalama yöntemi, iki protein dizisinin evrim ilişkisini de keşfedebilir. O zaman, bilim adamları proteinler için olduğu kadar bu gezegendeki yaşam için de evrim ağacı yaratabilirler [3].

İlgili Alanlar[değiştir]

Biyoinformatik ile ilgili alanlar [4]:

Biyofizik - fizik bilimlerinde bulunan teknikler ve kavramları kullanılarak biyolojinin araştırıldığı bir alan.

Farmakogenomikler - tüm genomun farmakolojik ve genetik bilgilerini depolamak ve işlemek için biyoinformatik tekniklerinin kullanıldığı bir alan.

Farmakogenetik - farmakogenomiklere benzer şekilde, bir ila birkaç gene odaklanmak ve genomların korelasyonlarını tanımlamak için biyoinformatik ve genomik teknikler kullanır.

Tıbbi bilişim - algoritmalar ve yapılar gibi bilgisayar uygulamalarının tıbbi bilgilerin etkili bir şekilde iletilmesine ve işlenmesine yardımcı olmak için kullanıldığı bir disiplindir.

Matematiksel biyoloji - biyolojinin süreçlerini temsil etmek, değerlendirmek ve modellemek için matematiksel araç ve yöntemleri kullanmaya odaklanan bir alandır.

Bilgisayarlı biyoloji - biyoinformatik gibi, biyolojik problemleri çözmek için bilgisayar uygulamalarını ve istatistiksel yöntemleri kullanmayı içerir. Bunun gibi, biyolojik modelleme, simülasyon ve görüntüleme, RNA yapısı ve gen tahmini, dizi hizalama algoritmaları ve çoklu dizi hizalaması gibi teknikleri mümkün kılar.

Proteomik - proteoma ait çalışmadır. Proteom, bir hücre, doku veya organizma tarafından ifade edilen proteinlerin tamamen toplanmasıdır. Proteinler belirli bir genom için tamamlayıcıdır.

Genomik - bu bilimsel dalın amacı, bir organizmanın tam DNA dizisi olan genomu DNA dizilimi ve haritalama yöntemlerini kullanarak araştırmaktır.

Kimeformatik - kimyada bulunan problemleri çözmek için bilgisayarların ve bilgi teknolojisinin kullanılması.

Kaynakça[değiştir]

  1. Nelson, David L. and Cox, Michael M. Lehninger Principles of Biochemistry. New York: W. H. Freeman & Company. 2008
  2. National Center for Biotechnology Information <http://www.ncbi.nlm.nih.gov/>
  3. 3,0 3,1 Berg, Jeremy M., Tymoczko, John L. and Stryer, Lubert. Biochemistry. New York: W. H. Freeman & Company. 2007
  4. Bioinformatics Organization. 2010. <http://wiki.bioinformatics.org/Bioinformatics_FAQ>