Yapay zeka ile ilgili bu tarz "yapay zeka X yapabilir mi?" türünde soruları düşünmeden önce o X dediğimiz şeyin ne olduğunum iyi tanımlanması ve anlaşılması gerek diye düşünüyorum. Mesela dinlemek ve izlemek nedir? Dinlemek sadece ses verisini işlemekten mi ibaret yoksa onu deneyimlemek midir? Bu deneyim için bir bilinç şart mıdır yoksa bilinç fizikalist bir düzeyde açıklanabilir mi? Bunlar yapay zeka konusundan bayağı sapan konular. O yüzden ben "yapay zeka x yapabilir mi?" sorusundan ziyade "yapay zeka nasıl yapar?" sorusuna odaklanmak istiyorum. Bunu "film izlemek" veya "müzik dinlemek" olarak sınıflandırmak senin bu aktiviteleri nasıl tanımladığına göre değişir.
Yapay zekaya bir filmi veri olarak verebiliriz. Mesela bir video kaydı arka arkaya dizilmiş görsellerden ibarettir. Bu dijital görseller bilgisayarda sayı tabloları yani matrisler olarak tutulmaktadır. Aynı şekilde dijital bir ses sinyali de uzun bir liste içerisinde tutulan ve analog sesten alınan ayrık örneklere karşılık gelen sayı dizisinden ibarettir. Bu sayısal verileri bir yapay sinir ağına vererek belli bir konuda eğitebilirsin. Yani yapay zekanın 2 saatlik bir filmi oturup 2 saat boyunca izlemesine gerek yoktur. Sayısal değerleri çok daha çabuk bir şekilde işleyebilir.
Ses ve görüntü gibi verileri işlemek için yapay sinir ağları kullanmak zorundayız. Yapay sinir ağları ise sadece birer fonksiyondan başka bir şey değildir. Yapay sinir ağıları evrensel olarak tüm sürekli fonksiyonlara yaklaşmak için kullanılan bir yapıdır. İstediğin kadar girdiyi istediğin kadar çıktıyla istediğin şekilde eşleştirmeni sağlayan çok karmaşık fonksiyonlardır. Mesela elinde 100x100 boyutunda bir resim var ve bu resimdeki kedi mi köpek mi ayırmak istiyorsun. Bu 100x100 boyutundaki resim aslında 10000 sayıdan oluşan bir tablodur. Dolayısıyla bize 10000 girdisi olan ve 2 çıktısı olan (kedi ve köpek) bir fonksiyon gerekmektedir. Bu fonksiyonu kurduktan sonra eğitim süreci başlar. Fonksiyonumuza çok sayıda veri veririz. Başta tamamen alakasız sonuçlar üretir ama eğitildikce kendi parametreleri ile oynayıp bu hatasını minimize eder. Bu eğitim sürecinde ise arka planda yapılan şey fonksiyonun bizim istediğimiz çıktılara yaklaşmasıdır sadece. Türev yardımıyla hata fonksiyonunu minimize ederiz. Eğitim süreci bittikten sonra ise daha önce hiç görmediği yeni resimler ile tahmin başarısını ölçeriz. İşte bu aşamada yapay zekanın yaptığı doğru tahine "evet, yapay zeka resmi izledi ve sonuç üretti" diyorsan sana göre bu yapay zeka film de izleyebilir, müzik de dinleyebilir. Yok eğer "bu sadece matematiksel bir dizi işlemden ibaret, gerçek bir deneyim değil" dersen o zaman da cevap hayır olacaktır.
(Mümkün olduğu kadar az teknik detaya girerek anlatmak istedim ama yapay zeka gibi çok popüler bir konuyu teknik detaya girmeden anlatmak bu teknolojinin fazla abartılmasına ve yanlış anlaşılmasına sebep oluyor.)