Yapay Nöral Ağların Nasıl Öğrendiğini Anlamak İçin Yeni Bir Formül Oluşturuldu!
Bu haber 7 ay öncesine aittir. Haber güncelliğini yitirmiş olabilir; ancak arşivsel değeri ve bilimsel gelişme/ilerleme anlamındaki önemi dolayısıyla yayında tutulmaktadır. Ayrıca konuyla ilgili gelişmeler yaşandıkça bu içerik de güncellenebilir.
Yapay nöral ağlar, finanstan insan kaynaklarına ve sağlık hizmetlerine kadar oldukça geniş bir uygulama skalasında kullanılan geniş dil modelleri de dahil olmak üzere, yapay zekâ alanındaki atılımlara güç veriyor. Ancak bu ağlar aynı zamanda, mühendislerin ve bilim insanlarının iç işleyişini anlamakta zorlandıkları birer kara kutu olmaya da devam ediyor. Fakat işler değişiyor, Kaliforniya San Diego Üniversitesi'nden veri ve bilgisayar bilimcileri önderliğinde bir ekip, yapay nöral ağların aslında nasıl öğrendiğini adeta gözler önüne serdi.
Araştırmacılar, istatiksel analizde kullanılan bir formülün, ChatGPT'nin öncüsü olan GPT-2 gibi yapay nöral ağların verilerdeki ilişkili kalıpları nasıl öğrendiği hakkında basitleştirilmiş bir matematiksel açıklama sağladığını keşfettiler. Bu formül aynı zamanda yapay nöral ağların tahminde bulunmak için söz konusu ilişkili kalıpları nasıl kullandığını da açıklıyor. UC San Diego Bilgisayar Bilimleri ve Mühendisliği bölümünde doktora öğrencisi olan ve çalışmanın eş-başyazarı olan Daniel Beaglehole, durumu şöyle açıklıyor:
Yapay nöral ağları temel prensipleriyle anlamaya çalışıyoruz. Formülümüzle birlikte insanlar, ağın tahminde bulunmak için hangi özellikleri kullandığını kolaylıkla yorumlayabilecek.
Ekip, bulgularını 7 Mart'ta Science Dergisi'nde yayınladı. Peki ya bunun önemi nedir? Günümüzde, yapay zekâ destekli araçlar gündelik hayatımıza nüfuz etmiş durumda. Bankalarda kredilerin onaylanması için, hastanelerde röntgen ve MRI gibi medikal verilerin analizi için kullanılıyorlar. Şirketlerde ise iş başvurularının taranması için kullanılıyorlar. Fakat bütün bu yaygın kullanıma rağmen günümüzde hâlâ, yapay nöral ağların nasıl karar verdiğini anlamak ve ağın eğitiminde kullanılan verilerdeki ön yargı ve yanılmaları ayıklamak çok zor. Çalışmanın sorumlu yazarı ve de aynı zamanda UC San Diego Halıcıoğlu Veri Bilimi Enstitüsü'nde profesör olan Mikhail Belkin, şunları söylüyor:
Eğer yapay nöral ağların nasıl öğrendiğini anlamıyorsanız ağların sağlıklı, isabetli ve uygun yanıtlar üretip üretmediğini anlamak son derece zordur. Bu konu, son dönemdeki makine öğrenmesi ve yapay nöral ağ teknolojilerinin hızlı büyümesi göz önüne alındığında muazzam bir önem arz etmektedir.
Haberini okumakta olduğunuz bu çalışma, Belkin'in araştırma grubunun yapay nöral ağların nasıl çalıştığını açıklayan matematiksel bir teori geliştirmeye çalıştığı daha büyük bir çalışmanın bir parçası. Belkin'in ifadesiyle teknoloji, teoriyi fersah fersah geride bıraktı ve teorinin teknolojiye yetişmesi gerekiyor.
Ekip, aynı zamanda yapay nöral ağların nasıl öğrendiğini anlamak için kullandıkları AGOP olarak da bilinen ("Average Gradient Outer Product", Tr: "Ortalama Gradyan Dış Ürün") istatiksel formülün yapay nöral ağ içermeyen diğer makine öğrenimi biçimlerinde de performans ve verimi artırmak için kullanılabileceğini bu çalışmayla göstermiş oldu. Belkin, şunları söylüyor:
Eğer yapay nöral ağların arka planındaki mekanizmaları anlayabilirsek daha basit, daha verimli ve daha anlaşılabilir makine öğrenimi modelleri oluşturabiliriz. Bunun, yapay zekânın umuma yayılmasında yardımcı olmasını bekliyoruz.
Belkin'in öngördüğü makine öğrenimi sistemleri daha az hesaplama gücüne ve dolayısıyla da şebekeden daha az enerjiye ihtiyaç duyuyor. Bu sistemler, aynı zamanda çok daha az karmaşık ve anlaması da çok daha kolay.
Yeni Bulgulara Bir Örnek
Yapay nöral ağlar, veri karakteristikleri arasındaki ilişkileri (yani, bir resimdeki spesifik bir objeyi ya da bir yüzü algılamayı) öğrenen bilgi-işlemsel araçlardır. Mesela, bir fotoğraftaki kişinin gözlük takıp takmadığını anlamak, yaptığı işi anlamamız için iyi bir örnek olabilir.
Makine öğrenimi, bu problemi, eğitilmekte olan yapay nöral ağa "gözlüklü insan" ve "gözlüksüz insan" olarak etiketlenmiş pek çok örnek eğitim fotoğrafı sunarak çözüme kavuşturuyor. Bu sayede ağ, fotoğraflar ve etiketleri arasındaki ilişkiyi öğrenmiş oluyor ve karar vermek için odaklanması gereken veri kalıp ve özelliklerini "öğrenebiliyor".
Yapay zekâ sistemlerinin kara kutular olarak görülmesinin bir sebebi de sistemlerin olası önyargılar da dahil olmak üzere tahminlerini yaparken aslında hangi kriterleri göz önünde bulundurduğunun matematiksel olarak açıklanmasının genel anlamda zor olması. Bu yeni çalışma, sistemlerin bu özellikleri nasıl öğrendiğine dair basit bir matematiksel açıklama sunuyor.
"Özellikler", aslında verilerdeki kalıplarla ilişkilidir. Yukarıdaki örnekte, yapay nöral ağların öğreneceği ve gerçekten de fotoğraftaki kişinin gözlük takıp takmadığına karar vereceği geniş bir "özellik" skalası vardı. Bu görev için dikkat etmesi gereken özelliklerden birisi yüzün üst kısmıydı. Diğer bir özellik olarak gözlüğün genellikle bulunduğu yer olan göz ya da burun çevresine dikkat edilebilirdi. Böylece ağ, ilgili olduğunu öğrendiği özellikleri seçip dikkatini oralara yoğunlaştırabilir ve yüzün aşağı kısmı, saç gibi resmin gereksiz/lüzumsuz bulduğu kısımlarını odak noktasından çıkarır.
Özellik öğrenimi (İng: "Feature learning"), verilerdeki ilişkili kalıpları tanıma yetisi sağlar ve daha sonrasında bu kalıplar, tahminde bulunmak için sistem tarafından kullanılır. Gözlük örneğine dönecek olursak; ağ, yüzün üst kısmına dikkat etme kalıbını öğrenmiş olur. İşte bu yeni Science baskısında araştırmacılar, yapay nöral ağların özellikleri nasıl öğrendiğini açıklayan istatiksel bir formül tanımladılar.
Aslında maddi destek istememizin nedeni çok basit: Çünkü Evrim Ağacı, bizim tek mesleğimiz, tek gelir kaynağımız. Birçoklarının aksine bizler, sosyal medyada gördüğünüz makale ve videolarımızı hobi olarak, mesleğimizden arta kalan zamanlarda yapmıyoruz. Dolayısıyla bu işi sürdürebilmek için gelir elde etmemiz gerekiyor.
Bunda elbette ki hiçbir sakınca yok; kimin, ne şartlar altında yayın yapmayı seçtiği büyük oranda bir tercih meselesi. Ne var ki biz, eğer ana mesleklerimizi icra edecek olursak (yani kendi mesleğimiz doğrultusunda bir iş sahibi olursak) Evrim Ağacı'na zaman ayıramayacağımızı, ayakta tutamayacağımızı biliyoruz. Çünkü az sonra detaylarını vereceğimiz üzere, Evrim Ağacı sosyal medyada denk geldiğiniz makale ve videolardan çok daha büyük, kapsamlı ve aşırı zaman alan bir bilim platformu projesi. Bu nedenle bizler, meslek olarak Evrim Ağacı'nı seçtik.
Eğer hem Evrim Ağacı'ndan hayatımızı idame ettirecek, mesleklerimizi bırakmayı en azından kısmen meşrulaştıracak ve mantıklı kılacak kadar bir gelir kaynağı elde edemezsek, mecburen Evrim Ağacı'nı bırakıp, kendi mesleklerimize döneceğiz. Ama bunu istemiyoruz ve bu nedenle didiniyoruz.
Araştırmacılar, bu formülün yapay nöral ağlara dayanmayan bilgi işlem sistemlerine eklenmesi halinde daha hızlı ve daha verimli öğrenme sağlandığını da gözler önüne serdiler. Belkin son olarak şunları söylüyor:
Nasıl oluyor da lüzumsuz şeyleri göz ardı ediyoruz? İnsanlar bu konuda oldukça iyidir. Makineler, örneğin büyük dil modelleri de aynı şeyi yapıyorlar. Onlar da bu 'seçici dikkat' mantığını kullanıyorlar fakat nasıl yaptıklarını bilmiyoruz. Science makalemizde yapay nöral ağların nasıl 'seçici olarak dikkat ettiklerinin' en azından bir kısmını açıklayan bir mekanizma sunuyoruz.
İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.
Soru & Cevap Platformuna Git- 3
- 3
- 2
- 1
- 1
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- A. Radhakrishnan, et al. (2024). Mechanism For Feature Learning In Neural Networks And Backpropagation-Free Machine Learning Models. Science. | Arşiv Bağlantısı
- I. Patringenaru. How Do Neural Networks Learn? A Mathematical Formula Explains How They Detect Relevant Patterns. (13 Mart 2024). Alındığı Tarih: 7 Nisan 2024. Alındığı Yer: UCSD | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 17/11/2024 13:43:37 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/17306
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.