Google DeepMind'ın Yeni Yapay Zeka Modeli AlphaGeometry2, Matematikte En Zeki Liselileri Geçebiliyor!

- Basın Bildirisi
- Yapay Zeka
- Bilim Haberciliği
26 Temmuz 2024'te Google DeepMind'ın matematik problemlerini çözmek için geliştirdiği yapay zeka modeli AlphaGeometry, üstün başarılı lise öğrencilerinin katıldığı Uluslararası Matematik Olimpiyatları'nda gümüş madalya seviyesine ulaşmayı başardığı açıklanmıştı.[1] Bu gelişmenin üzerinden henüz sadece 6 ay geçmişken DeepMind araştırma ekibi 5 Şubat 2025'te AlphaGeometry'nin yeni sürümü olan AlphaGeometry2'nin performansının altın madalya kazanan ortalama bir öğrencinin seviyesini geçtiğini duyurdu.[2] Imperial College London'dan matematikçi Kevin Buzzard, şöyle söylüyor:
Bilgisayarların Uluslararası Matematik Olimpiyatları'nda tam puan alması için çok uzun zaman beklememize gerek olmadığını düşünüyorum.
Uluslararası Matematik Olimpiyatları problemlerinin dört ana başlığından biri olan Öklid geometrisi, yapay zeka için özel bir beceri gerektirmektedir. Katılımcıların düzlemdeki geometrik nesnelerle ilgili ifadeler için kesin kanıtlar sunması beklenmektedir. Ekip bu yüzden AlphaGeometry2'yi Uluslararası Matematik Olimpiyatları'nın geometri dışı matematik problemlerini çözmek için tasarladıkları AlphaProof adlı yeni bir sistemle birlikte duyurmuşlardı.
AlphaGeometry, özel bir dil modeli ile insanlar tarafından kodlanan soyut mantığa dayalı nöro-sembolik bir sistemden oluşmaktadır. Modelin arkasındaki ekip, dil modelini matematiksel bir formal dil konuşacak şekilde eğitmiştir. Bu sayede çıktılar otomatik olarak mantıksal tutarlılık açısından kontrol edilebilmekte ve yapay zeka sohbet botlarında sık görülen ve halüsinasyon olarak bilinen tutarsız veya yanlış ifadeler elenebilmektedir.
AlphaGeometry2'de ise Google'ın en gelişmiş büyük dil modeli olan Gemini, modele entegre edilmiştir. Ayrıca, modele bir noktayı çizgi boyunca kaydırarak üçgenin yüksekliğini değiştirme gibi geometrik nesneleri düzlem üzerinde hareket ettirme ve doğrusal denklem çözme kabiliyetleri eklenmiştir.
AlphaGeometry, son 25 yıldaki Uluslararası Matematik Olimpiyatları geometri sorularının %54'ünü çözebilirken; AlphaGeometry2, bu soruların %84'ünü çözebilmektedir. 2024 yılında Hindistan ve Çin'den bazı yapay zeka araştırma ekipleri, altın madalya seviyesine ulaşan farklı yöntemler kullanmış olsa da bu yöntemler çok daha dar bir geometri problemi veriseti ile test edilmişti.
DeepMind ekibi, gelecek iyileştirmelerin eşitsizlikler ve doğrusal olmayan denklemler içeren matematik problemlerini kapsayacağını belirtiyor. Ekip bu sayede yapay zekanın geometriyi "tamamen çözme" hedefine bir adım daha yaklaşılacağını düşünüyor.
Genel testte altın madalya skoruna ulaşan ilk yapay zeka sistemi, AI Matematik Olimpiyatı Ödülü olarak adlandırılan 5 milyon ABD doları değerindeki bir ödülü kazanabilir — ancak bu yarışma, sistemlerin açık kaynaklı olmasını şart koştuğundan DeepMind bu kriteri karşılayamıyor.
Buzzard, DeepMind ile Hint ve Çin ekiplerinin kaydettiği hızlı ilerlemeden şaşırmadığını söylüyor. problemlerin zor olmasına rağmen konunun kavramsal olarak basit olduğunu ve yapay zekanın araştırma matematiği seviyesinde problemleri çözebilmesi için aşması gereken çok daha fazla zorluk olduğunu ekliyor.
Yapay zeka araştırmacıları, şimdi ise 2025 Temmuz'da Avustralya'nın Sunshine Coast kentinde düzenlenecek Uluslararası Matematik Olimpiyatları'nda mobellerini test edecekleri yeni matematik problemlerini bekliyor. İnsan katılımcıların çözdüğü bu sorular, yapay zeka sistemleri için de gerçek bir sınav olacak. Yapay zeka sistemleri, yarışmaya resmi olarak katılamıyor ve dolayısıyla madalya da kazanamıyor olsalar da uzmanlar 2025 Uluslararası Matematik Olimpiyatları'nda açıklanacak olan yeni matematik problemlerinin makine öğrenimi sistemlerinin eğitim verilerinde henüz bulunmuyor olması nedeniyle modelin becerisini değerlendirmek için en güvenilir test yöntemi olacağını vurguluyorlar.
Evrim Ağacı'nda tek bir hedefimiz var: Bilimsel gerçekleri en doğru, tarafsız ve kolay anlaşılır şekilde Türkiye'ye ulaştırmak. Ancak tahmin edebileceğiniz gibi Türkiye'de bilim anlatmak hiç kolay bir iş değil; hele ki bir yandan ekonomik bir hayatta kalma mücadelesi verirken...
O nedenle sizin desteklerinize ihtiyacımız var. Eğer yazılarımızı okuyanların %1'i bize bütçesinin elverdiği kadar destek olmayı seçseydi, bir daha tek bir reklam göstermeden Evrim Ağacı'nın bütün bilim iletişimi faaliyetlerini sürdürebilirdik. Bir düşünün: sadece %1'i...
O %1'i inşa etmemize yardım eder misiniz? Evrim Ağacı Premium üyesi olarak, ekibimizin size ve Türkiye'ye bilimi daha etkili ve profesyonel bir şekilde ulaştırmamızı mümkün kılmış olacaksınız. Ayrıca size olan minnetimizin bir ifadesi olarak, çok sayıda ayrıcalığa erişim sağlayacaksınız.
Makalelerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu makalemizle ilgili merak ettiğin bir şey mi var? Buraya tıklayarak sorabilirsin.
Soru & Cevap Platformuna Git- 4
- 1
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- ^ D. Castelvecchi. (2024). Deepmind Hits Milestone In Solving Maths Problems — Ai’s Next Grand Challenge. Springer Science and Business Media LLC, sf: 236-237. doi: 10.1038/d41586-024-02441-2. | Arşiv Bağlantısı
- ^ Y. Chervonyi, et al. (2025). Gold-Medalist Performance In Solving Olympiad Geometry With Alphageometry2. arXiv.org. | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 14/04/2025 10:40:58 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/20002
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.