Bir Veri Uzmanına Sorun: Yapay Öğrenme Nedir?

Bu yazının içerik özgünlüğü henüz kategorize edilmemiştir. Eğer merak ediyorsanız ve/veya belirtilmesini istiyorsanız, gözden geçirmemiz ve içerik özgünlüğünü belirlememiz için [email protected] üzerinden bize ulaşabilirsiniz.

“Yapay öğrenme” teriminin popüler hale geldiği günümüzde, bu terimin sıklıkla robotların dünyayı ele geçirmesine denk görülmesi beni şaşırtıyor.

“Sinir ağları” ve “derin öğrenme” gibi ifadeler hayal gücümüzü kışkırtıyor, ancak biz yeni ortaya çıkan teknoloji söz konusu olduğunda konuyu hemen robotların dünyayı ele geçirmesine getiriyoruz. Bu da yapay öğrenmenin gerçekte ne kadar güçlü ve güzel olduğunu görmemizi engelliyor. Bununla birlikte endüstriyi ileri götüren, çığır açan yeni gelişmeleri kaçırmış oluyoruz.

Aklımda bunlar dolaşırken “yapay öğrenme” ifadesini bize açıklaması için ekibimizin veri uzmanı Hilary Green-Lerman ile oturuyorum. Ona, Wikipedia’nın bile tam olarak cevaplamakta başarısız olduğu sorular soruyorum: Yapay öğrenme nedir? Bunu kim öğrenmelidir? Westworld’ü en yakın ne zaman ziyaret edebilirim? (Ç.N. Westworld: Gelişmiş yapay zekâya sahip insanımsı robotlarla ilgili bir TV dizisi ve bu dizide yer alan yapay dünya).

 

Yapay öğrenme nedir?

Hillary şöyle cevaplıyor:

“Yapay öğrenme, hâlihazırda var olan veriyi kullanarak tahminlerde bulunmamızı sağlar. Bu tanım gerçekten şık görünüyor, fakat çoğu zaman ‘tahmin’ denilen şey sadece bir etikettir.”

Yapay öğrenme, örüntünün tanınması ve veriden öğrenebilen, öğrendikleriyle tahminlerde bulunabilen algoritmaların uygulanmasıyla evrimleşmiştir ve hesaplamalı istatistikle yakından ilişkilidir (Wikipedia’ya teşekkürler).

Biz insanların kullandığı terimlerle ifade edersek bir bilgisayara bir şey “öğrettiğimiz” zaman, ona yavru köpek ve çörek fotoğraflarını sürekli gösterir, bu fotoğraflar için “bu bir yavru köpektir” ve “bu ise çörektir” deriz. Bilgisayar da hesaplamalı istatistik yöntemlerini kullanarak bu şeyin köpek cinsinden, diğer şeyin ise hamur işi olduğunu tespit etmeye başlar.

Chicago’daki Loyola Üniversitesi profesörlerinden fizikçi ve bilim iletişimcisi Robert McNees’ten bir tweet. Görsel: Tweeter
Chicago’daki Loyola Üniversitesi profesörlerinden fizikçi ve bilim iletişimcisi Robert McNees’ten bir tweet. Görsel: Tweeter

 

Bunun anlamı, bilgisayarınıza çok fazla sayıda veri seti verirseniz bir süre sonra sizin için tahminlerde bulunmaya başlayacak olmasıdır.

Örneğin biz bilgisayarları, harfleri ve rakamları doğru bir şekilde tahmin etmek üzere eğittik. Bu eğitim, posta servisinin de kullanmış olduğu el yazısı tanıma tekniğiyle aynı temel mantığa sahiptir. Bu mantık aynı zamanda, bir kadının hamile olduğunu tahmin etmeyi sağlayan Target testinde ya da sürücüsüz arabaların geliştirilmesinde de kullanılır.

Görsel: Alex Danvy, Teknoloji Pazarlamacısı, Microsoft
Görsel: Alex Danvy, Teknoloji Pazarlamacısı, Microsoft

 

Bu girişimler bize geleceğe ulaştığımızı hissettirse de yapay öğrenmenin aslında sadece güçlü bir matematik ve tahmin olduğunu unutmamalıyız. Vishal Maini şöyle diyor:

“Bir makinenin öğrenme algoritması, onun, gözlenen verideki örüntüleri tespit etmesini, o dünyayı açıklayan modeller oluşturmasını ve önceden açıkça programlanmış kurallar ve modellere sahip olmadan tahminlerde bulunmasını sağlar.”

İşte bu nedenden dolayı yapay öğrenme algoritmalarında farklı ekiplerin çalışıyor olması kritik öneme sahiptir. Bilgisayarı, gerçek dünyada çalışabilmesi için çok çeşitli özellikler ve olasılıklar ile beslemek zorundasınız.

Örneğin, siz yüz tanıma algoritması için bilgisayara sadece beyaz ırk görüntülerini verirseniz bilgisayar diğer renkten olan yüzler konusunda eğitilmemiş olacaktır. Bu hem kötü bir formül olur, hem insanlar için hem de Google örneğinde gördüğümüz gibi halkla ilişkiler açısından kötüdür.

 

Yapay öğrenmeyle ilgili popüler bir yanlış anlayış nedir?

Tahminin bir gücü vardır. Yapay öğrenmenin ne yapabileceğini fark eden biri anında kristal küreye şu soruları sormak ister:

  • Bir sonraki en iyi programlama dili ne olacak?
  • Bir sonraki seçimi kim kazanacak?
  • Bu yeni ürünü piyasaya çıkarmamızın bize getirisini tam olarak tahmin edebilir misin?

Ancak, veri uzmanımızı bu sorularla meşgul etmenin size bir faydası olmayacaktır. Hillary şunları söylüyor:

Popüler bir yanlış anlayış, insanların, ellerinde yeterli veri olmadığı halde öyle olduğunu düşünmeleridir. İnsanlar yapay öğrenme ifadesiyle, mevcut veriye dayanan çok geniş çaptaki tahminleri kastederler. Oysa böyle bir şey olabilmesi için, çok fazla sayıda etiketlenmiş veriye sahip olmalısınız.

Eğer hangi ürünü hangi tüketiciye önereceğinizi tahmin etmek istiyorsanız, veriye ihtiyacınız vardır. Henüz piyasada olmayan bir ürünle bunu yapamazsınız. Çok geniş çaplı bir veri setine ihtiyacınız olur, her bir ürünü satın alan her bir insan tipi için en azından bin örnek kadar… Eğer analiz etmek istediğiniz daha fazla özellikler de varsa, bu sayı üstel olarak artar. Burada ‘özellik’ olarak kastettiğimiz şey tüketicinin yaşı ya da daha önce tıkladıkları adresler gibi şeylerdir.

Yapay öğrenmeyi işiniz için kullanmak her zaman kolaylıkla erişemeyeceğiniz kadar büyük veri setleri gerektirir; hatta bu tür veri setlerine ulaşsanız bile, bu veri, makinenin okuyabileceği bir formatta olmak zorundadır. Hillary sözlerine şöyle devam ediyor:

İnsanlar yapay öğrenmenin büyük oranda, bir algoritmada çalıştırmak üzere veriyi bir formata sokmak demek olduğunu çoğunlukla fark etmezler. Algoritmalar genelde, önceden hazırlanmış olarak mevcuttur. Birçok durumda, veriniz için en iyi doğrusal regresyon yöntemini seçmeye ihtiyacınız vardır, ancak programlamanın karmaşık süreçlerini bilmek zorunda olmazsınız. Verinizi öyle bir formata sokmalısınız ki, her satır sizin ulaşmak istediğiniz bir veri noktası olmalıdır.

Örneğin eğer algoritmanızın X müşterisini inceleyip neleri satın alıp neleri satın almadığını ortaya çıkarmak istiyorsanız “satın aldı” ve “satın almadı” için değer atamalısınız. Bu da bir sürü veri temizleme anlamına gelir. Hillary şöyle diyor:

Esas olarak, sahip olduğunuz farklı bilgi parçalarını alıp bunları bir algoritmada çalışabilecek şekilde birbirine birleştirme gibi bir yığın iş yapmalısınız.

 

Popüler kültürde yapay öğrenmeyle ilgili en güvenilir referans nedir?

Biliyoruz ki bir bilgisayar, verileri analiz edebilmek için veri temizlemenin yanı sıra, belirli özelliklere değer atanmasına ihtiyaç duyar. Bu süreç tam olarak anlaşıldığında, robot bilinci ile ilgili her türlü korku ortadan kalkmaya başlar ve Hollywood’un yol açtığı moda bakış açısının ötesini görebilmeye başlarsınız. Doğal olarak Hillary ile bundan bahsettik:

“Westworld ile ilgili en büyük sorun, yani benim ‘bu artık inandırıcı olmaktan çıktı’ diye düşündüğüm nokta, Dolores ile konuştukları bir sahneydi. Bu sahnede Dolores konuşuyordu ve adam ona diyordu ki:

- Dur bir dakika. Bana bunu neden söyledin?

Dolores bu soruyu cevaplandırabiliyordu. Günümüzdeki en gelişmiş karmaşık mekanizma, sinir ağları ve derin öğrenmedir. Sistem içinde karşılaştığımız en büyük zorluk, “sinir ağları” ifadesini kullanmamıza karşın, düşünme şeklinin insanın düşünme şeklinden çok farklı olmasıdır. Dolores’in vermesi gereken cevap, “7” gibi bir şey, yani bir sonuca atanmış bir değer olmalıydı.”

Görsel: HBO
Görsel: HBO

 

Bununla birlikte, “sinir ağları” gibi bir ibarenin neden bu kadar gündeme geldiğini anlamak kolaydır. Bu ifade, duyulduğunda anlaşılan şeyi karşılamaktadır.

Sinir ağı, sinirlerin çalışma şeklini taklit etmek üzere oluşturulan küçük yapay öğrenme algoritmaları, yani küçük lojistik regresyonlar setidir. Daha sonra bu modeller bir görevi (genelde görüntü tanıma gibi karmaşık bir şey) yerine getirebilmek için “eğitilirler”. Çok yüksek bir bilgi işleme gücü gerektirirler, ancak çok etkilidirler. Burada “sanat” olarak değerlendirilebilecek şey, hangi eğitim setinin daha kullanışlı ve hangi “nöron” konfigürasyonunun daha uygun olduğuna karar vermektir.

 

Peki şu sıralar yapay öğrenme neden bu kadar popüler?

“Sinir ağları”, “derin öğrenme” gibi kavramların hepsi yapay öğrenmeye girer. Yapay öğrenme de günümüzde, bir zamanlar yetişkin boyama kitaplarının sahip olduğu popülariteye sahip gibi görünüyor.

Google Eğilim verisine bakarak “yapay öğrenme” kavramının popülerliğin zirvesinde olduğunu görebilirsiniz.Yapay öğrenme eğilimleri. Grafik: Google Trends
Yapay öğrenme eğilimleri. Grafik: Google Trends

Yetişkin boyama kitabı eğilimleri. Grafik: Google Trends
Yetişkin boyama kitabı eğilimleri. Grafik: Google Trends

 

Peki neden şimdi? Yapay öğrenmeye atıfta bulunan, “2001: Bir Uzay Destanı” ya da “Ex Machina” gibi bilimkurgu filmleri her zaman mevcuttu. Bu kavramın popülaritesindeki yüksek çıkışın nedeni nedir? Peki bu sadece geçici bir heves mi, yoksa geleceğe damgasını vuracak bir şey midir? Bunun cevabı basitçe, yapay öğrenmeyi şimdi gerçekleştirebiliyor olmamızdır. Hillary şunları söylüyor:

“Gerçekten büyük veri setlerine ihtiyacımız olduğunu söylemiştik. Eğer her bir internet sitesindeki tüm tıklamaları takip edebilsek, bu cidden devasa büyüklükte bir veri seti demek olur. Bu türden sayım sonuçları da, daha önce hiç olmadığı kadar bilgisayarımıza indirilebilir durumda.”

Şunu bir düşünün: Huffington Post gazetesinden Lauro Dambrosio’ya göre, 2016-2017 yıllarında, dünyadaki tüm verinin %90’ını ürettik. Laura’nın sözleriyle devam edelim:

“NoSQL veritabanları popüler oldu, SQL hızlandı, Apache Spark gibi projeler de büyük ölçekli veri işleme performansı ve hızında harikalar yarattı. Bir anda elimizde dağ gibi veri birikti, bu da bizim için, bir sonuca ulaşmamızda faydalı olabilecek hızlı ve ucuz araç demek.”

Hillary de şunları ekliyor:

“Bir düşünün; bugün yapay öğrenme için gereken veri satırıyla, Excel beş yıl önce başa çıkamıyordu. Bugün bizi sınırlayan tek şey hayal gücümüz ve AWS (Amazon Web Servisi) bütçemiz.”

 

İnsanlar yapay öğrenme becerilerini neden öğrenmeli?

Bu durumda, yapay öğrenmeyi öğrenmeli miyiz?

Forbes’a göre, “Yapay Öğrenme Mühendisleri, Veri Uzmanları ve Büyük Veri Mühendisleri LinkedIn sitesindeki yeni mesleklerde üst sıralarda yer alıyor. 2012’den bu yana, veri uzmanlarının rolü %650’den fazla arttı. Buna karşın günümüzde, ABD’de, veri bilimi yetenekleri olan 35.000 kişi var ve yüzlerce şirket bu pozisyona eleman arıyor.”

Bu bilgi, LinkedIn’in ABD’deki Yeni Meslekler 2017 raporuyla da onaylandı. “Yapay Öğrenme Mühendisliği”, en hızlı büyüyen meslek olarak listelendi.

Yeni meslekler

Eğer bu da yeterli değilse The New York Times’a göre geçtiğimiz dört yıl boyunca özellikle Google, Facebook, Apple, Amazon, Microsoft ve Çin firması Baidu’dan oluşan altı firma, özellikle üniversitelerden yapay zekâ yeteneklerini kapmak için bir yarış başlattılar. Bu mecrada yedi haneli maaşlar da duyulmuyor değil.

Bu spesifik alanlarda mühendislere aleni bir ihtiyaç var ve bu ihtiyaç giderek artıyor. Buna karşın, konuyla ilgili manşetlerin kaçırdığı bir noktaya ışık tutmalıyız.

Bir yüz tanıma sistemi inşa etmek ya da bir robotun duyguları tanımasını sağlamak, çok ileri seviyede bir matematik gerektirir. Ancak öğrenmek istediğiniz şey basit kümeleme (clustering) ya da regresyon yöntemlerine uygulamaya yetecek kadar yapay öğrenmeyse bu tamamen farklı bir konudur.

Ben de Hillary’ye sordum: Sana göre ben yapay öğrenme alanında anlamlı sayılabilecek ufacık bir şeye yetecek kadar programlama dilini ne kadar zamanda öğrenebilirim? Hillary şöyle yanıtladı:

Bu nasıl çalıştığına bağlı. Sanırım bunun için üniversitede bilgisayar bilimlerinde bir dönem kadar ders alman ya da altı-sekiz hafta boyunca her gün buna çalıştığın bir programa katılman gerekiyor. Eğer Python dilinde kısa bir program yazabilecek durumda değilsen veya “if (eğer)” ifadeleri ve “for (için)” döngüleri senin için bir anlam ifade etmiyorsa, daha kırk fırın ekmek yemelisin demektir. Yapay öğrenmeyi öğrenmenin temeli, kod yazmaktır.

Birçok yapay öğrenme algoritmasında kullanılan temel dil Python’dur. Python güçlü bir programlama dilidir, yeni başlayanlar için kolaydır ve iyi desteklenen bir dokümantasyonu vardır. Eğer yapay öğrenmeyi keşfetmek istiyorsanız kod yazma yeteneğiniz olup olmadığını merak ediyorsanız ya da bir kursa hazırlanıyorsanız Python kursuna bedava kayıt olabilirsiniz. Bu, size temel yetenekleri kazandırıp kod yazmanın büyülü dünyasının kapılarını açacaktır.


Yazan: Hillary Green-Lerman

Kaynak: Bu yazı codecademy.com adresinden çevrilmiştir.

Ana Görsel: Pixabay

DSİ: Su Elçileri Projesi

Evrim, Sadece Karmaşıklığa Doğru İlerleyen Bir Süreç Değil!

Yazar

Katkı Sağlayanlar

Şule Ölez
Şule Ölez
Editör
Damla Şahin
Damla Şahin
2. Editör
Konuyla Alakalı İçerikler
  • Anasayfa
  • Gece Modu

Göster

Şifremi unuttum Üyelik Aktivasyonu

Göster

Göster

Şifrenizi mi unuttunuz? Lütfen e-posta adresinizi giriniz. E-posta adresinize şifrenizi sıfırlamak için bir bağlantı gönderilecektir.

Geri dön

Eğer aktivasyon kodunu almadıysanız lütfen e-posta adresinizi giriniz. Üyeliğinizi aktive etmek için e-posta adresinize bir bağlantı gönderilecektir.

Geri dön

Close
Geri Bildirim