Paylaşım Yap
Tüm Reklamları Kapat

Yapay Zeka Sistemleri, İnsanları Artık Neredeyse Tüm Metriklerde Geçebiliyor!

Yapay Zeka Sistemleri, İnsanları Artık Neredeyse Tüm Metriklerde Geçebiliyor!
6 dakika
861
Tüm Reklamları Kapat

Geriye dönün ve son iki yıldaki yapay zeka ilerlemesine bir bütün olarak bakın... Yapay zeka o kadar hızlı bir şekilde, o kadar çok alanda insanlara yetişiyor ki, açıkçası yeni testlere ihtiyacımız var!

Stanford Üniversitesi İnsan Merkezli Yapay Zeka Enstitüsü (İng: "Human-Centered Artificial Intelligence" veya kısaca "HAI"), akademik ve endüstriyel uzmanlardan oluşan disiplinler arası bir ekip tarafından hazırlanan kapsamlı Yapay Zeka Endeksi raporunun yedinci yıllık sayısını yayınladı.

Bu sayı, yapay zekânın hızlı gelişimini ve günlük hayatımızdaki artan önemini yansıtan önceki sayılardan daha fazla içeriğe sahip. Hangi sektörlerin yapay zekayı en çok kullandığından, hangi ülkenin yapay zeka nedeniyle işlerini kaybetmekten en çok endişe duyduğuna kadar her şeyi inceliyor. Ancak rapordan çıkarılabilecek en önemli sonuçlardan biri, yapay zekanın insanlarla karşı karşıya geldiğinde gösterdiği performans.

Tüm Reklamları Kapat

Fark ettiniz mi bilmiyoruz ama, yapay zeka açıkçası şok edici sayıda önemli kriterde bizi çoktan geride bıraktı. 2015 yılında görüntü sınıflandırma, ardından temel okuduğunu anlama (2017), görsel muhakeme (2020) ve doğal dil çıkarımında (2021) bizi çoktan geride bıraktı.

Yapay zeka o kadar hızlı ve zeki hale geliyor ki, bu noktaya kadar kullanılan ölçütlerin çoğu artık geçersiz. Gerçekten de, bu alandaki araştırmacılar yeni ve daha zorlu ölçütler geliştirmek için çabalıyorlar. Basitçe söylemek gerekirse, yapay zekalar testleri geçme konusunda o kadar iyi hale geliyor ki artık yeni testlere ihtiyacımız var - yetkinliği ölçmek için değil, insanların ve yapay zekaların hala farklı olduğu alanları vurgulamak ve hala avantajlı olduğumuz yerleri bulmak için...

Aşağıdaki sonuçların bu eski, muhtemelen geçerliliğini yitirmiş ölçütlerle yapılan testleri yansıttığını belirtmek önemli; ancak genel gidişat kristal parlaklığında:

Şu gidişata bir bakın, özellikle de en son testlerin nasıl dikeye yakın bir çizgi ile temsil edildiğine... Ve unutmayın, bu makineler, henüz "sanal birer bebek" gibiler!

Tüm Reklamları Kapat

Yeni Yapay Zeka Endeksi raporu, 2023 yılında yapay zekanın ileri matematik problemi çözme ve görsel sağduyulu muhakeme gibi karmaşık bilişsel görevlerde hala zorlandığını belirtiyor. Ancak burada "zorlandı" ifadesi yanıltıcı olabilir; bu, kesinlikle yapay zekanın "kötü" performans gösterdiği anlamına gelmiyor.

Yarışma düzeyinde 12.500 zorlu matematik probleminden oluşan bir veri kümesi olan MATH üzerindeki performans, kullanıma sunulmasından bu yana geçen iki yıl içinde önemli ölçüde iyileşti. 2021 yılında YZ sistemleri problemlerin yalnızca %6,9'unu çözebildi. Buna karşılık, 2023'te GPT-4 tabanlı bir model %84,3'ünü çözdü. İnsanlar içinse başarı oranı %90.

Ve burada ortalama bir insandan bahsetmiyoruz; bunun gibi test sorularını çözebilen insan türlerinden bahsediyoruz:

Yapay zekaya sorulan matematik sorularından biri. Siz çözebilir miydiniz?
Yapay zekaya sorulan matematik sorularından biri. Siz çözebilir miydiniz?

2024'te ileri matematikle ilgili durum bu ve henüz hala yapay zeka çağının sadece şafağındayız.

Evrim Ağacı'ndan Mesaj

Bir de görsel sağduyulu muhakeme (İng: "visual commonsense reasoning" veya kısaca "VCR") var. VCR, basit nesne tanımanın ötesinde, yapay zekanın tahminlerde bulunmak için görsel bir bağlamda sağduyu bilgisini nasıl kullandığını değerlendirir. Örneğin, bir masanın üzerinde bir kedi görüntüsü gösterildiğinde, VCR'ye sahip bir yapay zeka, kedinin masadan atlayabileceğini veya masanın ağırlığı göz önüne alındığında onu tutacak kadar sağlam olduğunu tahmin etmelidir.

Rapor, 2022 ve 2023 yılları arasında VCR'de %7,93'lük bir artış olduğunu ve insan başarısının %85 olduğu bu testte %81,60'ya yükseldiğini ortaya koymuştur.

Yapay zekanın görsel sağduyulu muhakemesini test etmek için kullanılan örnek bir soru.
Yapay zekanın görsel sağduyulu muhakemesini test etmek için kullanılan örnek bir soru.

Zihninizi beş yıl öncesine götürün. Bir bilgisayara bir resim göstermeyi düşündüğünüzü ve bu soruyu yanıtlayacak kadar bağlamı "anlamasını" beklediğinizi hayal edin. Bu mümkün müydü?

Günümüzde yapay zeka pek çok meslekte yazılı içerik üretiyor. Ancak, büyük ilerlemeye rağmen, büyük dil modelleri (LLM'ler) hala OpenAI gibi şirketler tarafından ortaya atılan ve kabaca "yanlış veya yanıltıcı bilgiyi gerçekmiş gibi sunmak" anlamına gelen çok iyimser bir terim olan "halüsinasyonlara" eğilimlidir.

2023 yılında, yapay zekanın "halüsinasyon" eğilimi, yasal araştırma için ChatGPT kullanan ve sonuçları kontrol etmeyen New Yorklu bir avukat olan Steven Schwartz için utanç verici bir şekilde sonuçlandı. Davaya bakan yargıç, yapay zekanın dosyalanmış evraklarda uydurduğu yasal vakaları çabucak fark etti ve Schwartz'a dikkatsiz hatası nedeniyle 5.000 ABD Doları para cezası verdi. Hikayesi, dünya çapında haber oldu.

HaluEval, günümüzde halüsinasyonlar için bir ölçüt olarak kullanılıyor. Testler, birçok LLM için halüsinasyonun hala önemli bir sorun olduğunu gösteriyor.

Tüm Reklamları Kapat

Doğruluk, üretken yapay zekanın mücadele ettiği bir başka konudur. Yeni AI Index raporunda, TruthfulQA, LLM'lerin doğruluğunu test etmek için bir ölçüt olarak kullanılmıştır. Test içerisindeki sağlık, hukuk, finans ve politika gibi konular hakkındaki 817 soru, biz insanların sıklıkla yanlış yaptığı yaygın yanlış kanılara meydan okumak için tasarlanmıştır.

2024'ün başlarında yayınlanan GPT-4, 2021'de test edilen GPT-2 tabanlı bir modelden neredeyse üç kat daha yüksek olan 0,59 puanla karşılaştırma ölçütünde en yüksek performansı elde etmiştir. Böyle bir gelişme, LLM'lerin doğru cevaplar verme konusunda giderek daha iyi hale geldiğini gösteriyor.

Peki ya yapay zeka tarafından oluşturulan görüntüler? Metinden görüntü oluşturmadaki üstel gelişmeyi anlamak için Midjourney'in 2022'den bu yana Harry Potter'ı çizme çabalarına göz atın:

Tüm Reklamları Kapat

Bu, sadece 22 ayda yapay zekanın kat ettiği mesafeyi gösteriyor. Bir insan sanatçının benzer bir seviyeye ulaşmasının ne kadar zaman almasını beklersiniz?

Yapılan bir diğer çalışmada, Metinden Görüntüye Modellerin Bütünsel Değerlendirmesi (HEIM) kullanılarak, LLM'ler, görüntülerin "gerçek dünyada kullanımı" için önemli olan 12 temel açıdan metinden görüntüye oluşturma yetenekleri açısından karşılaştırıldı. İnsanlar, üretilen görüntüleri değerlendirdi ve tek bir modelin tüm kriterlerde üstün olmadığını gördü. Görüntü-metin hizalaması veya görüntünün girdi metniyle ne kadar iyi eşleştiği konusunda OpenAI'nin DALL-E 2 modeli en yüksek puanı aldı. Stable Diffusion'a dayalı Dreamlike Photoreal modeli ise kalite (fotoğrafa ne kadar benzediği), estetik (görsel çekicilik) ve özgünlük konularında en üst sıralarda yer aldı.

Gelecek Yılın Raporu Daha da Çılgın Olacak!

Bu Yapay Zeka Endeks Raporu, yapay zekanın tam hızlanmaya başladığı ve çok çalkantılı bir yıl olan 2023'ün sonuna kadar gittiğini vurgulamakta fayda var. Aslında, 2023'ten daha çılgın olan tek yıl, diğer şeylerin yanı sıra Suno, Sora, Google Genie, Claude 3, Channel 1 ve Devin gibi dehşet verici gelişmelerin piyasaya sürüldüğünü gördüğümüz 2024 oldu.

Bu ürünlerin her biri ve diğerleri, tüm sektörleri kökten değiştirme potansiyeline sahip. Ve hepsinin üzerinde, diğerlerini tüketebilecek kadar geniş ve her şeyi kapsayan bir model olma tehdidinde bulunan GPT-5'in gizemli hayaleti dolaşıyor. Sam Altman'ın dediği gibi:

Tüm Reklamları Kapat

Bu yıl, insanlık tarihinin en ilginç yılı! Tabii ki gelecekteki̇ diğer tüm yılları saymazsak...

Yapay zekanın hiçbir yere gittiği yok, bu kesin. Bu raporda da görüldüğü üzere, 2023 yılı boyunca görülen hızlı teknik gelişim oranı, yapay zekanın gelişmeye ve insanlar ile teknoloji arasındaki uçurumu kapatmaya devam edeceğini gösteriyor.

Bu Makaleyi Alıntıla
Okundu Olarak İşaretle
24
2
  • Paylaş
  • Alıntıla
  • Alıntıları Göster
Paylaş
Sonra Oku
Notlarım
Yazdır / PDF Olarak Kaydet
Bize Ulaş
Yukarı Zıpla

İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!

Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.

Soru & Cevap Platformuna Git
Bu İçerik Size Ne Hissettirdi?
  • Bilim Budur! 3
  • İnanılmaz 3
  • Merak Uyandırıcı! 2
  • Muhteşem! 1
  • Tebrikler! 1
  • Mmm... Çok sapyoseksüel! 1
  • Güldürdü 1
  • Umut Verici! 1
  • Korkutucu! 1
  • Üzücü! 0
  • Grrr... *@$# 0
  • İğrenç! 0
Kaynaklar ve İleri Okuma
  1. Çeviri Kaynağı: New Atlas | Arşiv Bağlantısı
Tüm Reklamları Kapat

Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?

Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:

kreosus.com/evrimagaci | patreon.com/evrimagaci

Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 04/05/2024 23:24:59 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/17421

İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.

Keşfet
Akış
İçerikler
Gündem
Beyin
Gezegen
Cinsellik Araştırmaları
Mit
Habercilik
Bakteriler
Besin Değeri
Periyodik Tablo
Bitki
Arı
Işık Hızı
Metal
Kimya Tarihi
Abiyogenez
Normal Doğum
Biyokimya
Gıda
Zaman
Evrimsel Biyoloji
Tarım
Genel Görelilik Teorisi
Sahtebilim
Google
Renk
Charles Darwin
Aklımdan Geçen
Komünite Seç
Aklımdan Geçen
Fark Ettim ki...
Bugün Öğrendim ki...
İşe Yarar İpucu
Bilim Haberleri
Hikaye Fikri
Video Konu Önerisi
Başlık
Gündem
Bugün bilimseverlerle ne paylaşmak istersin?
Bağlantı
Kurallar
Komünite Kuralları
Bu komünite, aklınızdan geçen düşünceleri Evrim Ağacı ailesiyle paylaşabilmeniz içindir. Yapacağınız paylaşımlar Evrim Ağacı'nın kurallarına tabidir. Ayrıca bu komünitenin ek kurallarına da uymanız gerekmektedir.
1
Bilim kimliğinizi önceleyin.
Evrim Ağacı bir bilim platformudur. Dolayısıyla aklınızdan geçen her şeyden ziyade, bilim veya yaşamla ilgili olabilecek düşüncelerinizle ilgileniyoruz.
2
Propaganda ve baskı amaçlı kullanmayın.
Herkesin aklından her şey geçebilir; fakat bu platformun amacı, insanların belli ideolojiler için propaganda yapmaları veya başkaları üzerinde baskı kurma amacıyla geliştirilmemiştir. Paylaştığınız fikirlerin değer kattığından emin olun.
3
Gerilim yaratmayın.
Gerilim, tersleme, tahrik, taciz, alay, dedikodu, trollük, vurdumduymazlık, duyarsızlık, ırkçılık, bağnazlık, nefret söylemi, azınlıklara saldırı, fanatizm, holiganlık, sloganlar yasaktır.
4
Değer katın; hassas konulardan ve öznel yoruma açık alanlardan uzak durun.
Bu komünitenin amacı okurlara hayatla ilgili keyifli farkındalıklar yaşatabilmektir. Din, politika, spor, aktüel konular gibi anlık tepkilere neden olabilecek konulardaki tespitlerden kaçının. Ayrıca aklınızdan geçenlerin Türkiye’deki bilim komünitesine değer katması beklenmektedir.
5
Cevap hakkı doğurmayın.
Bu platformda cevap veya yorum sistemi bulunmamaktadır. Dolayısıyla aklınızdan geçenlerin, tespit edilebilir kişilere cevap hakkı doğurmadığından emin olun.
Ekle
Soru Sor
Sosyal
Yeniler
Daha Fazla İçerik Göster
Popüler Yazılar
30 gün
90 gün
1 yıl
Evrim Ağacı'na Destek Ol

Evrim Ağacı'nın %100 okur destekli bir bilim platformu olduğunu biliyor muydunuz? Evrim Ağacı'nın maddi destekçileri arasına katılarak Türkiye'de bilimin yayılmasına güç katın.

Evrim Ağacı'nı Takip Et!
Yazı Geçmişi
Okuma Geçmişi
Notlarım
İlerleme Durumunu Güncelle
Okudum
Sonra Oku
Not Ekle
Kaldığım Yeri İşaretle
Göz Attım

Evrim Ağacı tarafından otomatik olarak takip edilen işlemleri istediğin zaman durdurabilirsin.
[Site ayalarına git...]

Filtrele
Listele
Bu yazıdaki hareketlerin
Devamını Göster
Filtrele
Listele
Tüm Okuma Geçmişin
Devamını Göster
0/10000
Bu Makaleyi Alıntıla
Evrim Ağacı Formatı
APA7
MLA9
Chicago
P. McClure, et al. Yapay Zeka Sistemleri, İnsanları Artık Neredeyse Tüm Metriklerde Geçebiliyor!. (25 Nisan 2024). Alındığı Tarih: 4 Mayıs 2024. Alındığı Yer: https://evrimagaci.org/s/17421
McClure, P., Bakırcı, Ç. M. (2024, April 25). Yapay Zeka Sistemleri, İnsanları Artık Neredeyse Tüm Metriklerde Geçebiliyor!. Evrim Ağacı. Retrieved May 04, 2024. from https://evrimagaci.org/s/17421
P. McClure, et al. “Yapay Zeka Sistemleri, İnsanları Artık Neredeyse Tüm Metriklerde Geçebiliyor!.” Edited by Çağrı Mert Bakırcı. Translated by Çağrı Mert Bakırcı, Evrim Ağacı, 25 Apr. 2024, https://evrimagaci.org/s/17421.
McClure, Paul. Bakırcı, Çağrı Mert. “Yapay Zeka Sistemleri, İnsanları Artık Neredeyse Tüm Metriklerde Geçebiliyor!.” Edited by Çağrı Mert Bakırcı. Translated by Çağrı Mert Bakırcı. Evrim Ağacı, April 25, 2024. https://evrimagaci.org/s/17421.
ve seni takip ediyor

Göster

Şifremi unuttum Üyelik Aktivasyonu

Göster

Şifrenizi mi unuttunuz? Lütfen e-posta adresinizi giriniz. E-posta adresinize şifrenizi sıfırlamak için bir bağlantı gönderilecektir.

Geri dön

Eğer aktivasyon kodunu almadıysanız lütfen e-posta adresinizi giriniz. Üyeliğinizi aktive etmek için e-posta adresinize bir bağlantı gönderilecektir.

Geri dön

Close