OpenAI'ın Yeni Çıkacak "Orion" Modeli, GPT-4 Üzerine Pek Bir Şey Koyamayacak!
ChatGPT Gibi Büyük Dil Modelleri Daha Fazla Gelişemiyor Olabilir!
The Information, OpenAI'nin kod adı "Orion" olan bir sonraki büyük dil modelinin beklenenden çok daha küçük performans artışları sağladığını bildirdi.[1] GPT-4 ve Orion arasındaki kalite iyileştirmesi, GPT-3 ve GPT-4 arasında gördüğümüzden çok daha az olacak gibi...
Dahası, The Information'ın kaynaklarına göre Orion, programlama gibi alanlarda selefi GPT-4'ü istikrarlı olarak da geçemiyor ve yalnızca dil yeteneklerinde gelişme gösteriyor. Modelin veri merkezlerinde çalıştırılması da önceki sürümlere göre daha maliyetli olacağa benziyor.
Eğitim Materyalleri Tükeniyor!
OpenAI araştırmacıları yavaşlamanın bir nedeni olarak yüksek kaliteli eğitim verilerinin yetersizliğine işaret ediyor. Kamuya açık metinlerin ve verilerin çoğu zaten kullanılmış durumda. The Information'ın haberine göre, OpenAI buna karşılık olarak Nick Ryder liderliğinde bir "Temeller Ekibi" oluşturdu.
Bu, CEO Sam Altman'ın Haziran 2024'te yaptığı, yeterli miktarda veri mevcut olsa da, odak noktasının daha az veriden daha fazlasını öğrenmeye kayacağı açıklamasıyla da uyumlu. Şirket, bu açığı kapatmaya yardımcı olmak için yapay zeka modelleri tarafından üretilen sentetik verileri (eğitim materyalleri) kullanmayı planlıyor.
The Information, Orion'un, GPT-4 ve OpenAI'nin yeni "akıl yürütme" modeli o1'den elde edilen sentetik veriler üzerinde kısmen eğitildiğini belirtiyor. Ancak bir OpenAI çalışanına göre bu yaklaşım, yeni modelin sadece "belirli yönlerden eski modellere benzemesi" riskini taşıyor.
LLM'deki Durgunluk, Sektör İçin Bir Zorluk Teşkil Ediyor!
Büyük Dil Modelleri (İng: "Large Language Model" veya kısaca "LLM") ilerlemesindeki yavaşlama OpenAI'nin da ötesine geçiyor. The Verge kısa süre önce Google'ın yakında çıkacak Gemini 2.0'ın şirket içi hedeflerin gerisinde kaldığını bildirdi. Anthropic'in, muhtemelen kullanıcıları ve yatırımcıları hayal kırıklığına uğratmaktan kaçınmak için amiral gemisi Opus'un 3.5 sürümünün geliştirilmesini durdurduğu ve bunun yerine geliştirilmiş bir Sonnet yayınladığı söyleniyor.
Açık kaynaklı modellerin son 18 ayda milyar dolarlık tescilli modellere yetişmesi, sektör genelindeki bu duraksamayı daha da belirginleştiriyor. Büyük teknoloji şirketleri devasa yatırımlarını etkin bir şekilde daha iyi yapay zeka performansına dönüştürebilseydi bu ilerleme pek mümkün olmazdı.
Ancak yakın zamanda verdiği ve aşağıdan izleyebileceğiniz bir röportajda, OpenAI CEO'su Sam Altman iyimserliğini korudu. "Yapay genel zeka"ya (AGI) giden yolun açık olduğunu ve ihtiyaç duyulan şeyin mevcut modellerin yaratıcı bir şekilde kullanılması olduğunu söyledi. Altman, LLM'lerin o1 ve ajansal yapay zeka gibi muhakeme yaklaşımlarıyla kombinasyonuna atıfta bulunuyor olabilir.
OpenAI'de önde gelen bir yapay zeka geliştiricisi ve o1'in oluşturulmasına yardımcı olan eski Meta çalışanı Noam Brown, Altman'ın açıklamasının çoğu OpenAI araştırmacısının görüşlerini yansıttığını söylüyor.
Yeni o1 modeli yeni ölçeklendirme fırsatları yaratmayı amaçlıyor. Odak noktasını eğitimden çıkarsamaya, yani yapay zeka modellerinin görevleri tamamlamak için sahip olduğu hesaplama süresine kaydırıyor. Brown bu yaklaşımın "ölçeklendirme için yeni bir boyut" olduğuna inanıyor.
Ancak bunun için milyarlarca dolar ve önemli miktarda enerji kullanımı gerekecek. Bu, önümüzdeki aylar için kilit bir endüstri sorusu: Her zamankinden daha güçlü yapay zeka modelleri ve bunların ihtiyaç duyduğu devasa veri merkezleri inşa etmek ekonomik ve çevresel açıdan mantıklı mı? OpenAI öyle düşünüyor gibi görünüyor.
Aslında maddi destek istememizin nedeni çok basit: Çünkü Evrim Ağacı, bizim tek mesleğimiz, tek gelir kaynağımız. Birçoklarının aksine bizler, sosyal medyada gördüğünüz makale ve videolarımızı hobi olarak, mesleğimizden arta kalan zamanlarda yapmıyoruz. Dolayısıyla bu işi sürdürebilmek için gelir elde etmemiz gerekiyor.
Bunda elbette ki hiçbir sakınca yok; kimin, ne şartlar altında yayın yapmayı seçtiği büyük oranda bir tercih meselesi. Ne var ki biz, eğer ana mesleklerimizi icra edecek olursak (yani kendi mesleğimiz doğrultusunda bir iş sahibi olursak) Evrim Ağacı'na zaman ayıramayacağımızı, ayakta tutamayacağımızı biliyoruz. Çünkü az sonra detaylarını vereceğimiz üzere, Evrim Ağacı sosyal medyada denk geldiğiniz makale ve videolardan çok daha büyük, kapsamlı ve aşırı zaman alan bir bilim platformu projesi. Bu nedenle bizler, meslek olarak Evrim Ağacı'nı seçtik.
Eğer hem Evrim Ağacı'ndan hayatımızı idame ettirecek, mesleklerimizi bırakmayı en azından kısmen meşrulaştıracak ve mantıklı kılacak kadar bir gelir kaynağı elde edemezsek, mecburen Evrim Ağacı'nı bırakıp, kendi mesleklerimize döneceğiz. Ama bunu istemiyoruz ve bu nedenle didiniyoruz.
AlphaProof'taki Gemini-LLM "Büyük Oranda Kozmetik" İdi!
Google yapay zeka uzmanı François Chollet ise, matematiksel görevler için dil modellerinin ölçeklendirilmesini eleştiriyor. Matematiksel ölçütlerdeki ilerlemenin yapay genel zekanın kanıtı olarak gösterilmesini "özellikle aptalca" olarak nitelendiriyor.
Chollet, ampirik verilerin derin öğrenme ve büyük dil modellerinin matematik problemlerini bağımsız olarak çözemeyeceğini gösterdiğini savunuyor. Bunun yerine, dil modellerinin yaptığı gibi olası yanıtları tahmin etmek yerine çeşitli çözüm yollarını kontrol eden sistematik yaklaşımlar olan ayrık arama yöntemlerine ihtiyaç duyduklarını söylüyor.
Ayrıca, dil modelleriyle ilgisi olmayan durumlarda bile "LLM" tabirinin mevcut tüm yapay zeka gelişmeleri için bir pazarlama terimi olarak kullanılmasını da eleştiriyor. Örneğin Gemini'nin Google Deepmind'ın AlphaProof'una entegrasyonunun "temelde kozmetik ve pazarlama amaçlı" olduğunu belirtiyor.
İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.
Soru & Cevap Platformuna Git- 10
- 4
- 1
- 1
- 1
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- Çeviri Kaynağı: The Decoder | Arşiv Bağlantısı
- ^ S. Palazzolo. Openai Shifts Strategy As Rate Of ‘Gpt’ Ai Improvements Slows. (10 Kasım 2024). Alındığı Tarih: 14 Kasım 2024. Alındığı Yer: The Information | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 18/12/2024 16:55:39 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/18993
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.
This work is an exact translation of the article originally published in The Decoder. Evrim Ağacı is a popular science organization which seeks to increase scientific awareness and knowledge in Turkey, and this translation is a part of those efforts. If you are the author/owner of this article and if you choose it to be taken down, please contact us and we will immediately remove your content. Thank you for your cooperation and understanding.