Paylaşım Yap
Tüm Reklamları Kapat

Biyolojik Dizilimler ve Derin Öğrenme: Biyolojik Veri Setleri, Yapay Zeka Araştırmalarında Nasıl Kullanılır?

Biyolojik Dizilimler ve Derin Öğrenme: Biyolojik Veri Setleri, Yapay Zeka Araştırmalarında Nasıl Kullanılır? Clinical Omics
DNA sarmalı, insan ve bilgisayarın ikili sayma sistemi
7 dakika
4,844
Evrim Ağacı Akademi: Yapay Zeka Uygulamaları Yazı Dizisi

Bu yazı, Yapay Zeka Uygulamaları yazı dizisinin 19. yazısıdır. Bu yazı dizisini okumaya, serinin 1. yazısı olan "Hayatlarımıza Giren 5 Yapay Zeka Ürünü: Sizin Yapay Zekanız Ne Kadar Zeki?" başlıklı makalemizden başlamanızı öneririz.

Yazı dizisi içindeki ilerleyişinizi kaydetmek için veya kayıt olun.

EA Akademi Hakkında Bilgi Al
Tıbbi İçerik Uyarısı

Bu içerik tıp ve sağlık ile ilişkilidir. Sadece bilgi amaçlı olarak hazırlanmıştır. Bireysel bir tıbbi tavsiye olarak görülmemelidir. Evrim Ağacı'ndaki hiçbir içerik; profesyonel bir hekim tarafından verilen tıbbi tavsiyelerin, konulan bir teşhisin veya önerilen bir tedavinin yerini alacak biçimde kullanılmamalıdır.

Daha Fazla Bilgi Al
Tüm Reklamları Kapat

Biyolojik bir dizilim ya da sekans, belirli nükleotit ya da amino asit yapılarının ardı ardına gelecek şekilde dizilmesiyle oluşur. Nükleotitler birer kimyasal bileşiklerdir ve nükleik asitlerinin temel yapısını oluştururlar. Lisede öğrendiğimiz kadarıyla en yaygın bilinen nükleotitler Adenin (A), Guanin (G), Timin (T), Sitozin (C) ve Urasil (U)'dir. Proteinler ise amino asit dizilimlerinden oluşurlar. Biyolojik dizilimleri içerisinde barındıran ve üzerinde en çok çalışılan makro moleküller arasında Deoksiribonükleik asit (DNA), Ribonükleik asit (RNA) ve proteinler bulunur. Canlı hücrelerde, bu makro moleküller dışında mikro RNA gibi küçük yapılı moleküller de bulunmaktadır.

Bir diğer bilinmesi gereken temel konu ise gen ekspresyonu ya da diğer adıyla gen ifadesidir. Gen ekspresyonu, DNA'ların işlevsel olan protein yapılarına dönüşmesine kadar olan süreçtir. DNA'dan RNA üretilme sürecine transkripsiyon, RNA' dan protein üretilme sürecine ise translasyon denir. Gen ekspresyonunun daha akılda kalması açısından YouTube üzerinde birçok animasyonlu video bulunmaktadır. McGraw-Hill'in bu harika animasyonu bunlardan birisi:

Örnek olması bakımından, bazı dizilim örneklerini şöyle sıralayabiliriz:

Tüm Reklamları Kapat

  • 10 nükleotitten oluşan örnek bir DNA sekansı: ATCCAGACAC
  • 10 nükleotitten oluşan örnek bir RNA sekansı: UAGGUCAGAA
  • 10 aminoasitten oluşan örnek bir protein sekansı: ALYHWTSGDE
Gen ekspresyon süreci
Gen ekspresyon süreci
researchgate

Derin Öğrenme Nedir?

Makine Öğrenmesi kapsamında "Yapay Sinir Ağları" kavramı ortaya atılmıştır. Bu kavram, insan beyninin sahip olduğu öğrenme mekanizmasının çok basit düzeyde simüle edilmiş halidir. Bu kavram, temel olarak aynı insan beyni gibi öğrenme süreci için gereken; girdiler, yapılan işlemler ve çıktılardan oluşur. İnsan beynindeki nöronlardaki dendritler, diğer nöronlardan bilgiyi girdi olarak alarak bilginin işlenme sürecine aracılık ederler. Bilgiler hücre gövdesinde işlenir ve aksonlar aracılığıyla sinapslara iletilir. Sinapslar ise diğer nöronlarla haberleşmek için bir çıktı görevi görürler.

İnsan Beynindeki Nöronlar ve Yapay Sinir Ağları
İnsan Beynindeki Nöronlar ve Yapay Sinir Ağları
MPLSVPN

Derin Öğrenme ise makine öğrenmesinin daha özelleşmiş bir halidir. Aslında, insan beyninin çalışma mekanizmasına biraz daha yakın bir yapıdadır denebilir. Ancak şunu da hatırlatmakta fayda var ki: Modern bilim halen insan beyninin öğrenme sürecini çok iyi açıklayabilmiş değildir ve bu konuyla ilgili halen çok fazla soru işareti bulunmaktadır. Derin öğrenmedeki yapay sinir ağları modelinde, makine öğrenmesindeki klasik yapay sinir ağları modelinden farklı olarak, girdi ve çıktılar arasında birden fazla gizli katman bulunmaktadır. Bu da derin sinir ağlarının daha karmaşık bir öğrenme sistemi olması sonucunu doğurmaktadır. Makine öğrenmesi ve derin öğrenme genel olarak sınıflandırma, kümeleme ve regresyon problemlerinde kullanılmaktadır.

Klasik Yapay Sinir Ağları - Derin Yapay Sinir Ağları
Klasik Yapay Sinir Ağları - Derin Yapay Sinir Ağları
towardsdatascience

Biyoenformatik ve Güncel Biyolojik Problemler

Biyoenformatik, yıllarca biriken karmaşık biyolojik bilgilerin anlamlandırılması, yorumlanması, görselleştirilmesi gibi süreçlere katkı sağlamak amacıyla bilgisayar bilimleri, istatistik, moleküler biyoloji, veri bilimi, genetik gibi alanları kullanarak oluşmuş disiplinler arası bir çalışma alanıdır. Bu kapsamda çeşitli biyolojik problemler vardır. Bunlardan bazıları şöyle sıralanabilir:

  • DNA dizilimi araştırmaları ya da genomik.
  • RNA dizilimi araştırmaları.
  • Protein dizilim ve araştırmaları ya da proteomik.
  • Makromoleküler yapıların (DNA, RNA, protein) 3 boyutlu modellenmesi.
  • Mikromoleküllerin (mikro RNA) gibi hedef bölgeye bağlanma tahmini, etkileşim araştırmaları.
  • Biyolojik veritabanlarının oluşturulması.
  • Birbiriyle etkileşen genler için etkileşim ağlarının oluşturulması.
  • Proteinlerin yapı ve fonksiyonlarının belirlenmesi.
  • Kanser genomiği ile kanser sürecinin anlaşılması.
  • Genetiğe dayalı ilaç geliştirme.
  • Genetik hastalıklara yatkınlığın incelenmesi.

Hangi Derin Öğrenme Yöntemi Kullanılmalı?

Biyolojik problemlerden bir örnek seçip, derin öğrenme yöntemlerinin bu problemi çözmek için nasıl kullanılabileceğini inceleyeceğiz. Problem, "mikro RNAların hedef mesajcı RNA bölgelerine bağlanma tahmini". Bu problemin çözümünü, kendi tez çalışmam üzerinden genel hatlarıyla inceleyebiliriz.

Tüm Reklamları Kapat

Mikro RNAlar, DNA'nın kodlanmayan bölgesinden sentezlenen, ortalama ~21-23 baz uzunluğunda gen düzenleyici, hücre içerisindeki dokuların biyosentezi gibi rolleri belirlenmiş, proteine dönüşmeyen, birçok canlı organizmada bulunan, küçük yapılı RNA molekülleridir. Mesajcı RNAların tamamlayıcı kısımlarına bağlanarak, transkripsiyon sonrası süreci engelleme ya da mesajcı RNA yıkımına neden olurlar. Böylece protein üretimine engel olabilirler.

Mikro RNAların, kanserden birçok nöropsikiyatrik hastalığa kadar geniş bir yelpazede rol oynayabileceği gösterilmiştir. Birçok mikro RNA hedef bağlanma bölgesi, deneysel ve hesaplamalı olarak bulunmasına rağmen bunların çok azı deneysel olarak doğrulanmıştır. Dolayısıyla, bilgisayar bilimleri yöntemleri kullanarak bu bağlanma bölgelerinin doğrulanması ve gen ekspresyon sürecinin daha iyi anlaşılması, üzerinde detaylıca çalışılan bir konudur. Şu animasyon, mikro RNAların gen düzenleyici rolünü anlatmaktadır:

Bir öğrenmenin gerçekleşebilmesi için verilerin sayısal olarak ifade edilmesi, modellenmesi gerekmektedir. Bu tez çalışmasındaki veri seti; mikro RNAlar, deneysel olarak belirlenmiş hedef mesajcı RNAlar, hedef mesajcı RNAlar üzerindeki bağlanma bölgeleri gibi girdi parametrelerinden oluşmaktadır.

Öğrenme sürecinden önceki veri ön işleme süreci, öğrenme işleminin başarısı için çok önemli bir basamaktır. Burada, öncelikle her bir mikro RNA ve mesajcı RNA arasında tamamlayıcı hizalama algoritması kullanılmıştır. Bu algoritmanın sonucunda, her bir ikili mikro RNA ve mesajcı RNA için tek bir dupleks sekansı oluşmaktadır. Yani her birbirine karşılık gelen farklı baz çifti, tek bir harfle ifade edilmiştir. Bu aşamadan sonra oluşan her sekans, çeşitli veri ön işleme algoritmaları ile sayısal ifadelere dönüştürülmüştür.

Evrim Ağacı'ndan Mesaj

Örnek bir Tamamlayıcı Hizalama Algoritması (Sequence Alignment Algorithm) ve Temsili Bir Dubleks Sekansı
Örnek bir Tamamlayıcı Hizalama Algoritması (Sequence Alignment Algorithm) ve Temsili Bir Dubleks Sekansı
Başkent Üniversitesi

Ardından bir derin öğrenme algoritması olan ve bir Tekrarlayan Sinir Ağları (RNN) yöntemi olan Uzun-Kısa Vadeli Bellek (LSTM) algoritması, çeşitli hiper-parametre optimizasyon yöntemleri de denenerek, verileri sınıflandırmak için kullanılmıştır. Son olarak problem, eldeki mesajcı RNA, ilgili mikro RNA için bir hedef bağlanma bölgesi midir yoksa değil midir şeklinde ikili bir sınıflandırma problemine dönüştürülmüştür.

Tez çalışmasında, 2 adet veri seti kullanılmıştır. İlk veri seti, diğerine nazaran daha az örneklem içermekte, dolayısıyla boyutu daha küçüktür. Klasik makine öğrenimi yöntemlerinden Destek Vektör Makineleri (Support Vector Machines), Karar Ağaçları (Decision Trees), k-En Yakın Komşuluk Algoritması (kNN), Rassal Orman (Random Forest) ve bu çalışmada kullanılan LSTM modeli, her iki veri seti için birer sınıflandırma yöntemi olarak kullanılmış ve çıkan sonuçlar çeşitli başarım metriklerine göre deneysel olarak birbirleriyle karşılaştırılmıştır.

Aşağıdaki tabloda DS1 olarak kastedilen: küçük boyutlu olan ilk veri setidir. M1, ... M34 ile kastedilen ise birbirinden farklı yöntemlerdir. Sırasıyla, DS1_M1: LSTM, DS1_M31: Support Vector Machines, DS1_M32: Decision Trees, DS1_M33: kNN, DS1_M34: Random Forest, Oğul et al. da ise stokastik bir yöntem olan Markov Zinciri yöntemi kullanılmıştır. Başarım metrikleri ise sırasıyla ACC: Doğruluk, TPR: Gerçek Pozitif Oranı, TNR: Gerçek Negatif Oranı, F1: F1 Skoru, AUC: ROC eğrisinin altında kalan alandır.

Küçük Boyutlu Bir Veriseti Üzerinde Klasik Makine Öğrenimi Yöntemleri ve Derin Öğrenme Tabanlı LSTM Yönteminin,  Bazı Başarım Metriklerine Göre Karşılaştırılması
Küçük Boyutlu Bir Veriseti Üzerinde Klasik Makine Öğrenimi Yöntemleri ve Derin Öğrenme Tabanlı LSTM Yönteminin, Bazı Başarım Metriklerine Göre Karşılaştırılması
acikerisim.baskent

Tablodaki sonuçlara göre, tez çalışmasında önerilen model, klasik makine öğrenimi algoritmalarına göre bazı yönlerden iyi sonuçlar verirken bazı yönlerden zayıf sonuçlar vermiştir.

Aşağıdaki tabloda DS2 olarak kastedilen: büyük boyutlu ikinci veri setidir. Sırasıyla, DS2_M5: LSTM, DS1_M32: Support Vector Machines, DS1_M33: Decision Trees, DS1_M34: kNN, DS1_M35: Random Forest, DeepMirTar: Stacked de-noising Auto Encoder, TargetScan: Lineer Regresyon, TarPmiR: Rassal Orman algoritmaları kullanılmıştır.

Büyük Boyutlu Bir Veriseti Üzerinde Klasik Makine Öğrenimi Yöntemleri, Derin Öğrenme Tabanlı LSTM Yöntemi, ve Literatürdeki Aynı Veriseti Üzerindeki Diğer Çalışmaların Bazı Başarım Metriklerine Göre Karşılaştırılması
Büyük Boyutlu Bir Veriseti Üzerinde Klasik Makine Öğrenimi Yöntemleri, Derin Öğrenme Tabanlı LSTM Yöntemi, ve Literatürdeki Aynı Veriseti Üzerindeki Diğer Çalışmaların Bazı Başarım Metriklerine Göre Karşılaştırılması
acikerisim.baskent

Yukarıdaki tablodan çıkan sonuçlara göre, önerilen LSTM modeli, DeepMirTar yöntemi hariç, diğer yöntemlerden çoğu metrik açısından daha başarılı sonuçlar vermiştir. Buradan ise bir Derin Öğrenme yöntemi olan LSTM'in, klasik makine öğrenmesi yöntemlerine göre karmaşık biyolojik dizilimlerden oluşan ve büyük boyutlu veri setlerinde daha başarılı sonuçlar verdiği gözlemlenmiştir. DeepMirTar yönteminin daha başarılı olmasının sebepleri ise güçlü bir hiperparametre optimizasyon yöntemi kullanılması, daha karmaşık bir yapay sinir ağı modeli ve öğrenme algoritması için gereken girdi temsillerinin daha iyi ifade edilmiş olması sonuçları çıkarılmıştır.

Tüm Reklamları Kapat

Çalışma sonucunda, Derin Öğrenme tabanlı LSTM algoritması, makine öğrenimi yöntemlerine göre genel olarak daha iyi sonuçlar verdiği gözlemlenmiştir. LSTM modeli yapısı itibariyle sinir ağındaki bir önceki girdileri hatırlama, unutma gibi bir hafıza mekanizmasına kayderek öğrenme işlemini gerçekleştirilmesiyle bilinir. Tartışılan biyolojik problemdeki sekanslar birbirinden farklı harfler içermekte ve uzunlukları birbirinden farklı olduğu için LSTM modeli genel olarak anlamlı sonuçlar vermiştir.

Bu Makaleyi Alıntıla
Okundu Olarak İşaretle
Evrim Ağacı Akademi: Yapay Zeka Uygulamaları Yazı Dizisi

Bu yazı, Yapay Zeka Uygulamaları yazı dizisinin 19. yazısıdır. Bu yazı dizisini okumaya, serinin 1. yazısı olan "Hayatlarımıza Giren 5 Yapay Zeka Ürünü: Sizin Yapay Zekanız Ne Kadar Zeki?" başlıklı makalemizden başlamanızı öneririz.

Yazı dizisi içindeki ilerleyişinizi kaydetmek için veya kayıt olun.

EA Akademi Hakkında Bilgi Al
28
0
  • Paylaş
  • Alıntıla
  • Alıntıları Göster
Paylaş
Sonra Oku
Notlarım
Yazdır / PDF Olarak Kaydet
Bize Ulaş
Yukarı Zıpla

İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!

Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.

Soru & Cevap Platformuna Git
Bu İçerik Size Ne Hissettirdi?
  • Tebrikler! 6
  • Merak Uyandırıcı! 5
  • Muhteşem! 3
  • Mmm... Çok sapyoseksüel! 3
  • İnanılmaz 2
  • Umut Verici! 1
  • Grrr... *@$# 1
  • Bilim Budur! 0
  • Güldürdü 0
  • Üzücü! 0
  • İğrenç! 0
  • Korkutucu! 0
Kaynaklar ve İleri Okuma
Tüm Reklamları Kapat

Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?

Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:

kreosus.com/evrimagaci | patreon.com/evrimagaci

Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 17/06/2024 20:52:42 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/8766

İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.

Keşfet
Akış
İçerikler
Gündem
Radyoaktif
Böcek
Albert Einstein
Yıldızlar
Sıcaklık
Model
Mavi
Doğum
Eczacılık
Tümör
Obezite
Evrimleşme
Etimoloji
Mers
Endokrin Sistemi
Bebek Doğumu
Kuyrukluyıldız
Eğitim
Ölçüm
Bilimkurgu
Balıklar
Bilim İnsanı
Elektrokimya
Kimyasal Evrim
Nöron
Aklımdan Geçen
Komünite Seç
Aklımdan Geçen
Fark Ettim ki...
Bugün Öğrendim ki...
İşe Yarar İpucu
Bilim Haberleri
Hikaye Fikri
Video Konu Önerisi
Başlık
Gündem
Bugün bilimseverlerle ne paylaşmak istersin?
Bağlantı
Kurallar
Komünite Kuralları
Bu komünite, aklınızdan geçen düşünceleri Evrim Ağacı ailesiyle paylaşabilmeniz içindir. Yapacağınız paylaşımlar Evrim Ağacı'nın kurallarına tabidir. Ayrıca bu komünitenin ek kurallarına da uymanız gerekmektedir.
1
Bilim kimliğinizi önceleyin.
Evrim Ağacı bir bilim platformudur. Dolayısıyla aklınızdan geçen her şeyden ziyade, bilim veya yaşamla ilgili olabilecek düşüncelerinizle ilgileniyoruz.
2
Propaganda ve baskı amaçlı kullanmayın.
Herkesin aklından her şey geçebilir; fakat bu platformun amacı, insanların belli ideolojiler için propaganda yapmaları veya başkaları üzerinde baskı kurma amacıyla geliştirilmemiştir. Paylaştığınız fikirlerin değer kattığından emin olun.
3
Gerilim yaratmayın.
Gerilim, tersleme, tahrik, taciz, alay, dedikodu, trollük, vurdumduymazlık, duyarsızlık, ırkçılık, bağnazlık, nefret söylemi, azınlıklara saldırı, fanatizm, holiganlık, sloganlar yasaktır.
4
Değer katın; hassas konulardan ve öznel yoruma açık alanlardan uzak durun.
Bu komünitenin amacı okurlara hayatla ilgili keyifli farkındalıklar yaşatabilmektir. Din, politika, spor, aktüel konular gibi anlık tepkilere neden olabilecek konulardaki tespitlerden kaçının. Ayrıca aklınızdan geçenlerin Türkiye’deki bilim komünitesine değer katması beklenmektedir.
5
Cevap hakkı doğurmayın.
Bu platformda cevap veya yorum sistemi bulunmamaktadır. Dolayısıyla aklınızdan geçenlerin, tespit edilebilir kişilere cevap hakkı doğurmadığından emin olun.
Ekle
Soru Sor
Sosyal
Yeniler
Daha Fazla İçerik Göster
Popüler Yazılar
30 gün
90 gün
1 yıl
Evrim Ağacı'na Destek Ol

Evrim Ağacı'nın %100 okur destekli bir bilim platformu olduğunu biliyor muydunuz? Evrim Ağacı'nın maddi destekçileri arasına katılarak Türkiye'de bilimin yayılmasına güç katın.

Evrim Ağacı'nı Takip Et!
Yazı Geçmişi
Okuma Geçmişi
Notlarım
İlerleme Durumunu Güncelle
Okudum
Sonra Oku
Not Ekle
Kaldığım Yeri İşaretle
Göz Attım

Evrim Ağacı tarafından otomatik olarak takip edilen işlemleri istediğin zaman durdurabilirsin.
[Site ayalarına git...]

Filtrele
Listele
Bu yazıdaki hareketlerin
Devamını Göster
Filtrele
Listele
Tüm Okuma Geçmişin
Devamını Göster
0/10000
Bu Makaleyi Alıntıla
Evrim Ağacı Formatı
APA7
MLA9
Chicago
A. Paker, et al. Biyolojik Dizilimler ve Derin Öğrenme: Biyolojik Veri Setleri, Yapay Zeka Araştırmalarında Nasıl Kullanılır?. (25 Mayıs 2020). Alındığı Tarih: 17 Haziran 2024. Alındığı Yer: https://evrimagaci.org/s/8766
Paker, A., Bakırcı, Ç. M. (2020, May 25). Biyolojik Dizilimler ve Derin Öğrenme: Biyolojik Veri Setleri, Yapay Zeka Araştırmalarında Nasıl Kullanılır?. Evrim Ağacı. Retrieved June 17, 2024. from https://evrimagaci.org/s/8766
A. Paker, et al. “Biyolojik Dizilimler ve Derin Öğrenme: Biyolojik Veri Setleri, Yapay Zeka Araştırmalarında Nasıl Kullanılır?.” Edited by Çağrı Mert Bakırcı. Evrim Ağacı, 25 May. 2020, https://evrimagaci.org/s/8766.
Paker, Ahmet. Bakırcı, Çağrı Mert. “Biyolojik Dizilimler ve Derin Öğrenme: Biyolojik Veri Setleri, Yapay Zeka Araştırmalarında Nasıl Kullanılır?.” Edited by Çağrı Mert Bakırcı. Evrim Ağacı, May 25, 2020. https://evrimagaci.org/s/8766.
ve seni takip ediyor

Göster

Şifremi unuttum Üyelik Aktivasyonu

Göster

Şifrenizi mi unuttunuz? Lütfen e-posta adresinizi giriniz. E-posta adresinize şifrenizi sıfırlamak için bir bağlantı gönderilecektir.

Geri dön

Eğer aktivasyon kodunu almadıysanız lütfen e-posta adresinizi giriniz. Üyeliğinizi aktive etmek için e-posta adresinize bir bağlantı gönderilecektir.

Geri dön

Close