Keşfedin, Öğrenin ve Paylaşın
Evrim Ağacı'nda Aradığın Her Şeye Ulaşabilirsin!
Paylaşım Yap
Tüm Reklamları Kapat

Yeni Yapay Zekâ Modeli GPT o3, Yapay Genel Zekâya Yönelik Geliştirilen Bir Testte Büyük Başarı Gösterdi!

o3 Modeli ARC-AGI Testi'nde Büyük Bir Atılım Gerçekleştirse de Halen Bir Yapay Genel Zekâ Değil!

5 dakika
379
Yeni Yapay Zekâ Modeli GPT o3, Yapay Genel Zekâya Yönelik Geliştirilen Bir Testte Büyük Başarı Gösterdi! Ars Technica
Tüm Reklamları Kapat

Yapay zekâ şirketi OpenAI, 20 Aralık 2024'te yeni yapay zekâ modeli o3'ü duyurdu.[1] o1 modelinin ardından gelen bu model (o2 adlandırması es geçildi), insan düzeyinde yapay zekâyı ifade eden bir yapay genel zekâ sistemine yönelik geliştirilen ve prestijli bir test kabul edilen ARC-AGI Testi'nde ("Abstraction and Reasoning Corpus - Artificial General Intelligence Challenge" / Tr: "Soyutlama ve Akıl Yürütme - Yapay Genel Zekâ Testi") yüksek bir puan elde ederek test rekorunu kırmayı başardı!

Yapay zekâ alanında ses getiren bu başarı, yapay zekâ meraklılarının o3 modelinin yapay genel zekâya ulaştığına dair spekülasyonlarda bulunmasına neden oldu. Ne var ki ARC-AGI Testi'ni yaratan bilim insanları, o3 modelinin bir yapay genel zekâ olmadığını ancak bu yolda önemli bir kilometre taşı olarak değerlendirilebileceğini ifade ediyor.

OpenAI'ın yeni o3 modeli, ARC-AGI-1 Açık Eğitim Seti üzerinde eğitilmiştir ve ilan edilen halka açık liderlik tablosundaki 10 bin dolarlık hesaplama sınırında "Yarı-Özel" Değerlendirme test dizisinde çığır açan bir başarıyla %75,7 puan almıştır. 172 kat yüksek hesaplama yapılandırmasına sahip o3 modeli ise %87,5'luk resmi olmayan puan elde etti.
OpenAI'ın yeni o3 modeli, ARC-AGI-1 Açık Eğitim Seti üzerinde eğitilmiştir ve ilan edilen halka açık liderlik tablosundaki 10 bin dolarlık hesaplama sınırında "Yarı-Özel" Değerlendirme test dizisinde çığır açan bir başarıyla %75,7 puan almıştır. 172 kat yüksek hesaplama yapılandırmasına sahip o3 modeli ise %87,5'luk resmi olmayan puan elde etti.
ARC-AGI

o3 modeli, ChatGPT'nin ardındaki büyük dil modellerinin (İng: "LLM") devamı niteliğinde olan bir dizi yapay zekâ sürümünün en yenisidir. ARC-AGI Testi'nin ana yaratıcısı olan ve Google'da yapay zekâ araştırmacısı olarak çalışan bilim insanı François Chollet, yayımladığı bir blog yazısında bu başarıyı şu şekilde değerlendiriyor:[2]

Tüm Reklamları Kapat

o3, GPT ailesindeki modellerde daha önce eşine rastlanmamış bir şekilde yeni görevlere uyum yeteneği göstermektedir ve bu atılım, yapay zekâ yeteneklerinde beklenmedik ve önemli bir sıçramadır.

o3 Modeli Tam Olarak Neyi Başardı?

2019'da François Chollet, 600 bin dolar tutarında ödüle sahip olan ARC-AGI Testi'ni, yapay zekâların renkli ızgara çiftleri arasındaki doğru desenleri bulma yeteneğini değerlendirme amacıyla geliştirmiştir. Bu tür görsel bulmacalar, yapay zekânın temel akıl yürütme yetenekleriyle bir tür genel zekâ sergilemesini gerektirmektedir. Ancak bu bulmacalarda yeterli miktarda hesaplama gücü kullanılacak olursa yapay zekâ modeli, akıl yürütme yapmaksızın yalnızca kaba kuvvet kullanarak bu bulmacaları çözebilir. Bundan ötürü test, resmi puanların belirli hesaplama gücü sınırları içinde kalmasını şart koşmaktadır.

2025'in başlarında piyasaya sürülmesi planlanan OpenAI'ın yeni o3 modeli, "yarı-özel" ARC-AGI Testi'nde %75,7’lik resmi bir atılım puanı elde etmiştir. Bu test, katılımcı modellerin herkese açık şekilde bir liderlik tablosunda sıralanmasını sağlamaktadır. o3 modeli, görsel bulmaca görevi başına yaklaşık 20 dolar olan hesaplama maliyeti ve toplamda 10 bin doların altında kalma şartını yerine getirerek bu sonuca imza atmayı başarmıştır. Ancak 600 bin dolarlık büyük ödül sonucunu belirlemek için kullanılan daha zorlu olan "özel" testte, görev başına yalnızca 10 cent harcanmasını gerektiren daha katı bir hesaplama sınırı ve kullanılan modelin açık kaynak olması zorunluluğu bulunmaktadır ve OpenAI'ın o3 modeli bu gereksinimleri karşılayamamıştır.

o3 modeli, bu testte resmi sınırın yaklaşık 172 katından daha fazla bir hesaplama gücü kullanarak %87,5'lik resmi olmayan bir puan elde etmiştir. Karşılaştırma yapmak gerekirse, sıradan bir insanın bu testteki ortalama puanı %84'tür ve %85'lik bir puan, hesaplama maliyetinin belirlenen sınırlar içinde kalması koşuluyla ARC-AGI Testi'nin 600 bin dolarlık büyük ödülünü kazanmaya yeterlidir. Ancak o3 modelinin maliyeti, resmi olmayan bu %87,5'luk puana ulaşmak için her görev başına binlerce dolara ulaşmıştır. OpenAI, testin geliştiricilerinden bu maliyetlerin tam detaylarını yayımlamamaları talebinde bulunmuştur.

Yüksek hesaplama kapasitesine sahip o3 modelinin testlerinden elde edilen verileri (sonuçlar, denemeler ve istem) aşağıdan inceleyebilirsiniz.

Tüm Reklamları Kapat

ARC-AGI Task ID: c6e1b8da
ARC-AGI Task ID: c6e1b8da
ARC-AGI
ARC-AGI Task ID: 0d87d2a6
ARC-AGI Task ID: 0d87d2a6
ARC-AGI
ARC-AGI Task ID: b457fec5
ARC-AGI Task ID: b457fec5
ARC-AGI

o3 Modelinin Başarısı Yapay Genel Zekâya Ulaşıldığını Gösteriyor mu?

Kısa cevap: Hayır. ARC-AGI Testi'nin geliştiricileri, bu yarışma kriterinin aşılmasının yapay genel zekâya ulaşıldığının bir göstergesi olmadığını açıkça belirtmektedirler. ARC-AGI Testi'nin geliştiricilerinden biri olan Mike Knoop, sosyal medya platformu X üzerinden yaptığı bir paylaşımda o3 modelinin çok yüksek miktarda hesaplama gücü kullanmasına rağmen 100'den fazla görsel bulmaca görevini çözmeyi başaramadığını belirtmektedir.

Santa Fe Enstitüsünde profesörlük yapan bilişsel bilimci Melanie Mitchell ise sosyal medya platformu Bluesky'da yaptığı bir paylaşımda şöyle söylüyor:

Bu görevlerin kaba kuvvet kullanarak hesaplama yoluyla çözülmesi, orijinal amacın boşa çıkarılması anlamına gelir.

François Chollet, o3 modelinin ilerlemesini değerlendirdiği bir X paylaşımında şu ifadeleri kullanıyor:

Yeni model çok etkileyici ve yapay genel zekâya giden yolda büyük bir dönüm noktasını temsil ediyor. Ancak bu model bir yapay genel zekâ değildir; halen o3'ün testte çözemediği oldukça kolay görevler bulunmaktadır.

Ayrıca Chollet yapay zekânın bir insan seviyesinde zekâ sergilediğinin nasıl anlaşılacağı konusunda şunları söylüyor:

Evrim Ağacı'ndan Mesaj

Evrim Ağacı'nın çalışmalarına Kreosus, Patreon veya YouTube üzerinden maddi destekte bulunarak hem Türkiye'de bilim anlatıcılığının gelişmesine katkı sağlayabilirsiniz, hem de site ve uygulamamızı reklamsız olarak deneyimleyebilirsiniz. Reklamsız deneyim, sitemizin/uygulamamızın çeşitli kısımlarda gösterilen Google reklamlarını ve destek çağrılarını görmediğiniz, %100 reklamsız ve çok daha temiz bir site deneyimi sunmaktadır.

Kreosus

Kreosus'ta her 10₺'lik destek, 1 aylık reklamsız deneyime karşılık geliyor. Bu sayede, tek seferlik destekçilerimiz de, aylık destekçilerimiz de toplam destekleriyle doğru orantılı bir süre boyunca reklamsız deneyim elde edebiliyorlar.

Kreosus destekçilerimizin reklamsız deneyimi, destek olmaya başladıkları anda devreye girmektedir ve ek bir işleme gerek yoktur.

Patreon

Patreon destekçilerimiz, destek miktarından bağımsız olarak, Evrim Ağacı'na destek oldukları süre boyunca reklamsız deneyime erişmeyi sürdürebiliyorlar.

Patreon destekçilerimizin Patreon ile ilişkili e-posta hesapları, Evrim Ağacı'ndaki üyelik e-postaları ile birebir aynı olmalıdır. Patreon destekçilerimizin reklamsız deneyiminin devreye girmesi 24 saat alabilmektedir.

YouTube

YouTube destekçilerimizin hepsi otomatik olarak reklamsız deneyime şimdilik erişemiyorlar ve şu anda, YouTube üzerinden her destek seviyesine reklamsız deneyim ayrıcalığını sunamamaktayız. YouTube Destek Sistemi üzerinde sunulan farklı seviyelerin açıklamalarını okuyarak, hangi ayrıcalıklara erişebileceğinizi öğrenebilirsiniz.

Eğer seçtiğiniz seviye reklamsız deneyim ayrıcalığı sunuyorsa, destek olduktan sonra YouTube tarafından gösterilecek olan bağlantıdaki formu doldurarak reklamsız deneyime erişebilirsiniz. YouTube destekçilerimizin reklamsız deneyiminin devreye girmesi, formu doldurduktan sonra 24-72 saat alabilmektedir.

Diğer Platformlar

Bu 3 platform haricinde destek olan destekçilerimize ne yazık ki reklamsız deneyim ayrıcalığını sunamamaktayız. Destekleriniz sayesinde sistemlerimizi geliştirmeyi sürdürüyoruz ve umuyoruz bu ayrıcalıkları zamanla genişletebileceğiz.

Giriş yapmayı unutmayın!

Reklamsız deneyim için, maddi desteğiniz ile ilişkilendirilmiş olan Evrim Ağacı hesabınıza yapmanız gerekmektedir. Giriş yapmadığınız takdirde reklamları görmeye devam edeceksinizdir.

Sıradan insanlar için kolay ama yapay zekâ için zor olan görevler oluşturmanın imkânsız hale geldiği gün, yapay genel zekânın burada olduğunu anlayacaksınız.

Oregon Üniversitesinde yapay zekâ araştırmacısı olan önde gelen bilgisayar bilimci Thomas Dietterich, yapay genel zekânın tanımlanması konusunda şöyle söylüyor:

Bu tür sistemlerin insan bilişinde gerekli olan tüm işlevsel bileşenleri içereceği öne sürülmektedir. Bu ölçüte göre piyasadaki yapay zekâ sistemleri; episodik bellek, planlama, mantıksal akıl yürütme ve en önemlisi metabilişim gibi bileşenlerden yoksundur.

Sonuç: o3 Modelinin Başarısının Önemi

o3 modelinin aldığı yüksek puan, yapay zekâ modellerinin 2024'teki gelişim hızının 2023'teki sarsıcı ilerlemelerle karşılaştırıldığında daha yavaş bir seyir izlediği bir dönemde elde edilmiş olması bakımından önemlidir.

ARC-AGI Testi'ni geçememiş olsa da o3'ün yüksek puanı, yapay zekâ modellerinin yakın gelecekte önemli kriterleri aşabileceğini açıkça göstermektedir. Chollet, o3 modelinin resmi olmayan yüksek puanının ötesinde, resmi olarak düşük hesaplama gücüyle teste giren birçok diğer yapay zekâ modelinin, "özel" değerlendirme test setinde daha şimdiden %81'in üzerinde puanlar aldığını belirtmektedir.

Yapay genel zekâ kavramına şüpheyle yaklaşan bilgisayar bilimci Dietterich de, bu performans sıçramasını "çok etkileyici" olarak nitelendirmektedir. Dietterich, şöyle söylüyor:

Bu sonuç çok etkileyici olsa da OpenAI'ın o1 ve o3 modellerinin nasıl çalıştığı hakkında daha fazla bilgi olmadan bu yüksek puanın ne derece etkileyici olduğunu değerlendirmek mümkün değildir. Tam anlamıyla bir değerlendirme yapabilmek için testin açık kaynaklı şekilde tekrarlanmasını beklememiz gerekecek.

Ayrıca, o3 modelinin ARC-AGI Testi'ndeki problemleri uygulama imkânına erişmiş olması, gelecek modellerin başarısını kolaylaştırabilir. Öte yandan ARC-AGI geliştiricileri, 2025 yılında daha zorlu bir dizi yeni kıyaslama testi başlatmayı planlamaktadır.

Evrim Ağacı, sizlerin sayesinde bağımsız bir bilim iletişi platformu olmaya devam edecek!

Evrim Ağacı'nda tek bir hedefimiz var: Bilimsel gerçekleri en doğru, tarafsız ve kolay anlaşılır şekilde Türkiye'ye ulaştırmak. Ancak tahmin edebileceğiniz Türkiye'de bilim anlatmak hiç kolay bir iş değil; hele ki bir yandan ekonomik bir hayatta kalma mücadelesi verirken...

O nedenle sizin desteklerinize ihtiyacımız var. Eğer yazılarımızı okuyanların %1'i bize bütçesinin elverdiği kadar destek olmayı seçseydi, bir daha tek bir reklam göstermeden Evrim Ağacı'nın bütün bilim iletişimi faaliyetlerini sürdürebilirdik. Bir düşünün: sadece %1'i...

O %1'i inşa etmemize yardım eder misiniz? Evrim Ağacı Premium üyesi olarak, ekibimizin size ve Türkiye'ye bilimi daha etkili ve profesyonel bir şekilde ulaştırmamızı mümkün kılmış olacaksınız. Ayrıca size olan minnetimizin bir ifadesi olarak, çok sayıda ayrıcalığa erişim sağlayacaksınız.

Avantajlarımız
"Maddi Destekçi" Rozeti
Reklamsız Deneyim
%10 Daha Fazla UP Kazanımı
Özel İçeriklere Erişim
+5 Quiz Oluşturma Hakkı
Özel Profil Görünümü
+1 İçerik Boostlama Hakkı
ve Daha Fazlası İçin Evrim Ağacı'nda..
Aylık
Tek Sefer
Destek Ol
₺30/Aylık
Bu Makaleyi Alıntıla
Okundu Olarak İşaretle
7
1
  • Paylaş
  • Alıntıla
  • Alıntıları Göster
Paylaş
Sonra Oku
Notlarım
Yazdır / PDF Olarak Kaydet
Bize Ulaş
Yukarı Zıpla

Feragatname: Evrim Ağacı, doğrudan üniversiteler, akademik dergiler veya resmi bilim kurumları tarafından yayınlanan bu basın açıklamalarını temel editöryal düzenlemeden geçirmektedir; ancak açıklamaların isabetliliğinden sorumlu değildir.

Makalelerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!

Bu makalemizle ilgili merak ettiğin bir şey mi var? Buraya tıklayarak sorabilirsin.

Soru & Cevap Platformuna Git
Bu Makale Sana Ne Hissettirdi?
  • Muhteşem! 0
  • Tebrikler! 0
  • Bilim Budur! 0
  • Mmm... Çok sapyoseksüel! 0
  • Güldürdü 0
  • İnanılmaz 0
  • Umut Verici! 0
  • Merak Uyandırıcı! 0
  • Üzücü! 0
  • Grrr... *@$# 0
  • İğrenç! 0
  • Korkutucu! 0
Kaynaklar ve İleri Okuma
  • ^ OpenAI. O3 Preview & Call For Safety Researchers. (20 Aralık 2024). Alındığı Tarih: 24 Aralık 2024. Alındığı Yer: OpenAI | Arşiv Bağlantısı
  • ^ F. Chollet. Openai O3 Breakthrough High Score On Arc-Agi-Pub. (20 Aralık 2024). Alındığı Tarih: 24 Aralık 2024. Alındığı Yer: ARC Prize | Arşiv Bağlantısı
  • A. Wilkins. $1M Prize For Ai That Can Solve Puzzles That Are Simple For Humans. (25 Haziran 2024). Alındığı Tarih: 24 Aralık 2024. Alındığı Yer: New Scientist | Arşiv Bağlantısı
Tüm Reklamları Kapat

Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?

Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:

kreosus.com/evrimagaci | patreon.com/evrimagaci

Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 18/02/2025 06:48:37 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/19381

İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.

Aklımdan Geçen
Komünite Seç
Aklımdan Geçen
Fark Ettim ki...
Bugün Öğrendim ki...
İşe Yarar İpucu
Bilim Haberleri
Hikaye Fikri
Video Konu Önerisi
Başlık
Bugün bilimseverlerle ne paylaşmak istersin?
Gündem
Bağlantı
Ekle
Soru Sor
Stiller
Kurallar
Komünite Kuralları
Bu komünite, aklınızdan geçen düşünceleri Evrim Ağacı ailesiyle paylaşabilmeniz içindir. Yapacağınız paylaşımlar Evrim Ağacı'nın kurallarına tabidir. Ayrıca bu komünitenin ek kurallarına da uymanız gerekmektedir.
1
Bilim kimliğinizi önceleyin.
Evrim Ağacı bir bilim platformudur. Dolayısıyla aklınızdan geçen her şeyden ziyade, bilim veya yaşamla ilgili olabilecek düşüncelerinizle ilgileniyoruz.
2
Propaganda ve baskı amaçlı kullanmayın.
Herkesin aklından her şey geçebilir; fakat bu platformun amacı, insanların belli ideolojiler için propaganda yapmaları veya başkaları üzerinde baskı kurma amacıyla geliştirilmemiştir. Paylaştığınız fikirlerin değer kattığından emin olun.
3
Gerilim yaratmayın.
Gerilim, tersleme, tahrik, taciz, alay, dedikodu, trollük, vurdumduymazlık, duyarsızlık, ırkçılık, bağnazlık, nefret söylemi, azınlıklara saldırı, fanatizm, holiganlık, sloganlar yasaktır.
4
Değer katın; hassas konulardan ve öznel yoruma açık alanlardan uzak durun.
Bu komünitenin amacı okurlara hayatla ilgili keyifli farkındalıklar yaşatabilmektir. Din, politika, spor, aktüel konular gibi anlık tepkilere neden olabilecek konulardaki tespitlerden kaçının. Ayrıca aklınızdan geçenlerin Türkiye’deki bilim komünitesine değer katması beklenmektedir.
5
Cevap hakkı doğurmayın.
Aklınızdan geçenlerin bu platformda bulunmuyor olabilecek kişilere cevap hakkı doğurmadığından emin olun.
Sosyal
Makaleler
Daha Fazla İçerik Göster
Popüler Yazılar
30 gün
90 gün
1 yıl
Evrim Ağacı'na Destek Ol

Evrim Ağacı'nın %100 okur destekli bir bilim platformu olduğunu biliyor muydunuz? Evrim Ağacı'nın maddi destekçileri arasına katılarak Türkiye'de bilimin yayılmasına güç katın.

Evrim Ağacı'nı Takip Et!
Yazı Geçmişi
Okuma Geçmişi
Notlarım
İlerleme Durumunu Güncelle
Okudum
Sonra Oku
Not Ekle
Kaldığım Yeri İşaretle
Göz Attım

Evrim Ağacı tarafından otomatik olarak takip edilen işlemleri istediğin zaman durdurabilirsin.
[Site ayalarına git...]

Filtrele
Listele
Bu yazıdaki hareketlerin
Devamını Göster
Filtrele
Listele
Tüm Okuma Geçmişin
Devamını Göster
0/10000
Bu Makaleyi Alıntıla
Evrim Ağacı Formatı
APA7
MLA9
Chicago
M. Köse, et al. Yeni Yapay Zekâ Modeli GPT o3, Yapay Genel Zekâya Yönelik Geliştirilen Bir Testte Büyük Başarı Gösterdi!. (27 Aralık 2024). Alındığı Tarih: 18 Şubat 2025. Alındığı Yer: https://evrimagaci.org/s/19381
Köse, M., Alparslan, E. (2024, December 27). Yeni Yapay Zekâ Modeli GPT o3, Yapay Genel Zekâya Yönelik Geliştirilen Bir Testte Büyük Başarı Gösterdi!. Evrim Ağacı. Retrieved February 18, 2025. from https://evrimagaci.org/s/19381
M. Köse, et al. “Yeni Yapay Zekâ Modeli GPT o3, Yapay Genel Zekâya Yönelik Geliştirilen Bir Testte Büyük Başarı Gösterdi!.” Edited by Eda Alparslan. Evrim Ağacı, 27 Dec. 2024, https://evrimagaci.org/s/19381.
Köse, Mücahid. Alparslan, Eda. “Yeni Yapay Zekâ Modeli GPT o3, Yapay Genel Zekâya Yönelik Geliştirilen Bir Testte Büyük Başarı Gösterdi!.” Edited by Eda Alparslan. Evrim Ağacı, December 27, 2024. https://evrimagaci.org/s/19381.
ve seni takip ediyor

Göster

Şifremi unuttum Üyelik Aktivasyonu

Göster

Şifrenizi mi unuttunuz? Lütfen e-posta adresinizi giriniz. E-posta adresinize şifrenizi sıfırlamak için bir bağlantı gönderilecektir.

Geri dön

Eğer aktivasyon kodunu almadıysanız lütfen e-posta adresinizi giriniz. Üyeliğinizi aktive etmek için e-posta adresinize bir bağlantı gönderilecektir.

Geri dön

Close