Yapay Zekâ Otofajisi: Üretken Modeller, Hem Kendilerinin Hem de Bildiğimiz Anlamıyla İnternetin Sonu Olabilir!

- Basın Bildirisi
- Uygulamalı Yapay Zeka
- Bilim Haberciliği
OpenAI'ın GPT4-o'su veya StabilityAI'ın Stable Diffusion'u gibi üretken yapay zekâ modelleri kod, metin, resim ve video üretmekte şaşırtıcı derecede yetenekli. Ancak bu modelleri eğitmek o kadar büyük miktarda veri gerektiriyor ki yapay zekâ mühendisleri şimdiden teknik sınırlamalarla karşılaşmaya başladı ve yakında model eğitmek için veri bulamayabilirler!
Bu veri kıtlığı durumunda, yeni nesil yapay zekâ modellerini eğitmek için sentetik veriler kullanmak teknoloji endüstrisi için cazip bir fikir olabilir. Yapay zekâ tarafından üretilen veriler gerçek dünyadan alınmış verilere göre çok daha ucuz ve sınırsız şekilde üretilebilir; başka yapay zekâ modellerini eğitmekte kullanılabilirler. Ancak bu da tıbbi verilerin kullanıldığı durumlar gibi bazı senaryolarda güvenlik riskleri teşkil eder. Öte yandan bazı durumlarda ise sentetik veri kullanmak modelin performansını artırabilir.
Rice Üniversitesi Dijital Sinyal İşleme grubunun yürüttüğü bir çalışma ise sentetik veri kullanmanın yapay zekânın gelecekteki versiyonları üzerinde bariz negatif etkileri olabileceğini öne sürüyor. Rice Üniversitesinde Elektrik ve Bilgisayar Mühendisliği Profesörü olan Richard Baraniuk, çalışma hakkında şunları söylüyor:
Sentetik verilerle model eğittiğinizde kaçınılmaz olarak bir döngüye giriyorsunuz. Buna otofajik döngü veya "kendi kendini tüketen döngü" adını veriyoruz. Ekibimiz bu geri bildirim döngülerine odaklandı ve ne yazık ki sentetik verilerle birkaç nesillik bir eğitim sürdürdüğümüzde yeni modellerin düzeltilemez derecede bozulduğunu gördük. Büyük Dil Modelleri bağlamında, bu duruma "model çöküşü" ismi verilmişti, ancak biz deli dana hastalığına ithafen "model otofaji bozukluğu" (MAD, İngilizcede bu kısaltma "deli" anlamına geliyor.) isminin daha uygun olduğunu düşünüyoruz.
Deli dana hastalığı, ineklerde görülen ölümcül bir nörodejeneretif hastalıktır. İnsanlarda ise aynı prionlardan kaynaklanan Creutzfeldt Jakob hastalığı, enfekte et tüketiminden kaynaklı olarak görülebilir. 1980 ve 90'larda patlak veren bir salgın, hastalığın ineklere kesilen diğer ineklerin artıklarının verilmesiyle artığını göstermiştir. Araştırmacıların kendi kendini tüketen yapay zekâlara bu ismi vermek istemesi de bundandır, bu yapay zekâ modelleri inekler gibi kendi türdeşlerinden kalanlarla beslenmektedir. Baraniuk, şunları söylüyor:
Otofajik eğitimin sorunlarını daha iyi gösterebilmek için görüntü üreten yapay zekâ modelleri üstünde çalıştık. Ancak başka ekiplerin de ifade ettiği gibi aynı durum Büyük Dil Modellerinde de gözleniyor.
İnternet, çoğu zaman modelleri eğitmek için oluşturulan veri setlerinin kaynağıdır. Yani sentetik veriler çevrim içi ortamlara sızdığında yapay zekâ modellerinin çıktılarında otofajik döngülerin ortaya çıkması beklenebilir. Bunun ne gibi sonuçları olabileceğini anlamak isteyen Baraniuk ve ekibi, gerçek ve sentetik verilerin üretken modellerin eğitiminde nasıl birleştirildiğini göstermek için tasarlanmış kendini tüketen üç farklı eğitim döngüsünü inceledi:
- Tamamen Sentetik Döngü: Üretken bir model, önceki nesil modelin çıktılarıyla, yani tamamen sentetik verilerle beslendi (eğitildi).
- Sentetik Artırım Döngüsü: Aynı modelin her nesli, bir önceki nesilden gelen çıktılarla ve sabit bir gerçek veri setinin kombinasyonu ile eğitildi.
- Taze Veri Döngüsü: Aynı modelin her nesli, bir önceki nesilden gelen çıktılarla ve her nesil için taze eklenen gerçek bir veri setinin kombinasyonuyla eğitildi.
Bu döngülerin ilerleyen iterasyonlarında, zaman geçtikçe ve yeni gerçek veriler sağlanmadıkça modellerin gitgide çarpıklaşan, ya kalite ya da özgünlükten yoksun çıktılar verdiği gözlemlendi. Başka bir deyişle, ne kadar taze veri varsa yapay zekâ da o kadar sağlıklı oluyordu.
Bir modelin art arda ürettiği resim veri setlerini yan yana koyup baktığınızda yapay zekâ modellerinin geleceğine dair ürkütücü bir tablo ortaya çıkıyor. İnsan yüzleri temalı veri setlerinde her yeni üretimle birlikte çizgiler gözlenmeye başlıyor, araştırmacılar bu çizgiler gibi beklenmedik görüntülere "üretim eserleri" (İng: "generative artifacts") adını veriyor.

İlgi çekici başka bir durumsa her yeni veri setinde, resimlerdeki insanların birbirlerine daha çok benzemeye başlaması. Sayılara ait görsellerin üretilmesi istenen veri setleri ise zamanla sayı sembollerinden ziyade anlamsız karalamalara benziyor.

Alt kısımda ise bu çıktılar için kullanılan eğitim veri setlerindeki sentetik ve gerçek verilerin dağılımı gösteriliyor.
Baraniuk, bu durumu şöyle yorumluyor:
Teorik ve deneysel sonuçlarımız, üretken modeller giderek yaygınlaştıkça ve başka modelleri eğitmek üzere veri setleri üretip otofajik döngüler oluşturdukça işlerin nereye gideceğine dair çıkarımlar yapmamızı sağlıyor. Kesin olan birkaç şey var: Yeterince taze veri olmadan gelecekte eğitilecek modeller "kafayı yemeye" mahkûm!
Araştırmacılar, simülasyonları mümkün olduğunca gerçeğe yaklaştırmak adına, örneklem hatalarını ve cımbızlama safsatasını belirtecek bir parametre kullandı. Bu parametrenin pratikteki karşılığıysa veri setlerindeki resim veya metinlerin güzel görünmesi veya güzel bir anlatımla sunulması karşılığında gözden çıkarılan çeşitlilik. Yani, modeller daha az çeşitlilikle daha "nizami" sonuçlar sunuyorlar ve bunu ne derecede yaptıklarının ölçülmesi gerekiyor.
Veri setlerindeki belirli girdilerin seçilmesi ya da cımbızlanmasının nedeni, bu yöntemin farklı üretim döngülerinde kalitenin korunmasına yol açması. Yani örnekteki gibi tüm resimlerdeki yüzler tek bir yüze benzerse belirli bir standart korunmuş oluyor. Elbette bu da modellerin çıktı çeşitliliğinde dramatik bir düşüş anlamına geliyor. Baraniuk, bu konuda şunları söylüyor:
Olabilecek en kötü şeylerden birisi, bu otofaji durumunun elimizdeki verilerin kalitesine balta vurması ve internetteki çeşitliliği genel olarak ortadan kaldırmasıdır. Kısacası, yapay zekâ otofajisinin çok yakın gelecekte öngöremediğimiz sonuçlara yol açacağı kesin.
Evrim Ağacı'nda tek bir hedefimiz var: Bilimsel gerçekleri en doğru, tarafsız ve kolay anlaşılır şekilde Türkiye'ye ulaştırmak. Ancak tahmin edebileceğiniz Türkiye'de bilim anlatmak hiç kolay bir iş değil; hele ki bir yandan ekonomik bir hayatta kalma mücadelesi verirken...
O nedenle sizin desteklerinize ihtiyacımız var. Eğer yazılarımızı okuyanların %1'i bize bütçesinin elverdiği kadar destek olmayı seçseydi, bir daha tek bir reklam göstermeden Evrim Ağacı'nın bütün bilim iletişimi faaliyetlerini sürdürebilirdik. Bir düşünün: sadece %1'i...
O %1'i inşa etmemize yardım eder misiniz? Evrim Ağacı Premium üyesi olarak, ekibimizin size ve Türkiye'ye bilimi daha etkili ve profesyonel bir şekilde ulaştırmamızı mümkün kılmış olacaksınız. Ayrıca size olan minnetimizin bir ifadesi olarak, çok sayıda ayrıcalığa erişim sağlayacaksınız.
Makalelerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu makalemizle ilgili merak ettiğin bir şey mi var? Buraya tıklayarak sorabilirsin.
Soru & Cevap Platformuna Git- 5
- 1
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- S. Alemohammad, et al. (2024). Self-Consuming Generative Models Go Mad. International Conference on Learning Representations (ICLR). | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 21/02/2025 13:22:33 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/18608
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.