Bir Veri Uzmanına Sorun: Yapay Öğrenme Nedir?
- İndir
- Dış Sitelerde Paylaş
“Yapay öğrenme” teriminin popüler hale geldiği günümüzde, bu terimin sıklıkla robotların dünyayı ele geçirmesine denk görülmesi beni şaşırtıyor.
“Sinir ağları” ve “derin öğrenme” gibi ifadeler hayal gücümüzü kışkırtıyor, ancak biz yeni ortaya çıkan teknoloji söz konusu olduğunda konuyu hemen robotların dünyayı ele geçirmesine getiriyoruz. Bu da yapay öğrenmenin gerçekte ne kadar güçlü ve güzel olduğunu görmemizi engelliyor. Bununla birlikte endüstriyi ileri götüren, çığır açan yeni gelişmeleri kaçırmış oluyoruz.
Aklımda bunlar dolaşırken “yapay öğrenme” ifadesini bize açıklaması için ekibimizin veri uzmanı Hilary Green-Lerman ile oturuyorum. Ona, Wikipedia’nın bile tam olarak cevaplamakta başarısız olduğu sorular soruyorum: Yapay öğrenme nedir? Bunu kim öğrenmelidir? Westworld’ü en yakın ne zaman ziyaret edebilirim? (Ç.N. Westworld: Gelişmiş yapay zekâya sahip insanımsı robotlarla ilgili bir TV dizisi ve bu dizide yer alan yapay dünya).
Yapay Öğrenme Nedir?
Hillary şöyle cevaplıyor:
Yapay öğrenme, hâlihazırda var olan veriyi kullanarak tahminlerde bulunmamızı sağlar. Bu tanım gerçekten şık görünüyor, fakat çoğu zaman ‘tahmin’ denilen şey sadece bir etikettir.
Yapay öğrenme, örüntünün tanınması ve veriden öğrenebilen, öğrendikleriyle tahminlerde bulunabilen algoritmaların uygulanmasıyla evrimleşmiştir ve hesaplamalı istatistikle yakından ilişkilidir (Wikipedia’ya teşekkürler).
Biz insanların kullandığı terimlerle ifade edersek bir bilgisayara bir şey “öğrettiğimiz” zaman, ona yavru köpek ve çörek fotoğraflarını sürekli gösterir, bu fotoğraflar için “bu bir yavru köpektir” ve “bu ise çörektir” deriz. Bilgisayar da hesaplamalı istatistik yöntemlerini kullanarak bu şeyin köpek cinsinden, diğer şeyin ise hamur işi olduğunu tespit etmeye başlar.
Bunun anlamı, bilgisayarınıza çok fazla sayıda veri seti verirseniz bir süre sonra sizin için tahminlerde bulunmaya başlayacak olmasıdır.
Örneğin biz bilgisayarları, harfleri ve rakamları doğru bir şekilde tahmin etmek üzere eğittik. Bu eğitim, posta servisinin de kullanmış olduğu el yazısı tanıma tekniğiyle aynı temel mantığa sahiptir. Bu mantık aynı zamanda, bir kadının hamile olduğunu tahmin etmeyi sağlayan Target testinde ya da sürücüsüz arabaların geliştirilmesinde de kullanılır.
Bu girişimler bize geleceğe ulaştığımızı hissettirse de yapay öğrenmenin aslında sadece güçlü bir matematik ve tahmin olduğunu unutmamalıyız. Vishal Maini şöyle diyor:
Bir makinenin öğrenme algoritması, onun, gözlenen verideki örüntüleri tespit etmesini, o dünyayı açıklayan modeller oluşturmasını ve önceden açıkça programlanmış kurallar ve modellere sahip olmadan tahminlerde bulunmasını sağlar.
İşte bu nedenden dolayı yapay öğrenme algoritmalarında farklı ekiplerin çalışıyor olması kritik öneme sahiptir. Bilgisayarı, gerçek dünyada çalışabilmesi için çok çeşitli özellikler ve olasılıklar ile beslemek zorundasınız.
Örneğin, siz yüz tanıma algoritması için bilgisayara sadece beyaz ırk görüntülerini verirseniz bilgisayar diğer renkten olan yüzler konusunda eğitilmemiş olacaktır. Bu hem kötü bir formül olur, hem insanlar için hem de Google örneğinde gördüğümüz gibi halkla ilişkiler açısından kötüdür.
Aslında maddi destek istememizin nedeni çok basit: Çünkü Evrim Ağacı, bizim tek mesleğimiz, tek gelir kaynağımız. Birçoklarının aksine bizler, sosyal medyada gördüğünüz makale ve videolarımızı hobi olarak, mesleğimizden arta kalan zamanlarda yapmıyoruz. Dolayısıyla bu işi sürdürebilmek için gelir elde etmemiz gerekiyor.
Bunda elbette ki hiçbir sakınca yok; kimin, ne şartlar altında yayın yapmayı seçtiği büyük oranda bir tercih meselesi. Ne var ki biz, eğer ana mesleklerimizi icra edecek olursak (yani kendi mesleğimiz doğrultusunda bir iş sahibi olursak) Evrim Ağacı'na zaman ayıramayacağımızı, ayakta tutamayacağımızı biliyoruz. Çünkü az sonra detaylarını vereceğimiz üzere, Evrim Ağacı sosyal medyada denk geldiğiniz makale ve videolardan çok daha büyük, kapsamlı ve aşırı zaman alan bir bilim platformu projesi. Bu nedenle bizler, meslek olarak Evrim Ağacı'nı seçtik.
Eğer hem Evrim Ağacı'ndan hayatımızı idame ettirecek, mesleklerimizi bırakmayı en azından kısmen meşrulaştıracak ve mantıklı kılacak kadar bir gelir kaynağı elde edemezsek, mecburen Evrim Ağacı'nı bırakıp, kendi mesleklerimize döneceğiz. Ama bunu istemiyoruz ve bu nedenle didiniyoruz.
Yapay Öğrenmeyle İlgili Popüler Bir Yanlış Anlayış Nedir?
Tahminin bir gücü vardır. Yapay öğrenmenin ne yapabileceğini fark eden biri anında kristal küreye şu soruları sormak ister:
- Bir sonraki en iyi programlama dili ne olacak?
- Bir sonraki seçimi kim kazanacak?
- Bu yeni ürünü piyasaya çıkarmamızın bize getirisini tam olarak tahmin edebilir misin?
Ancak, veri uzmanımızı bu sorularla meşgul etmenin size bir faydası olmayacaktır. Hillary şunları söylüyor:
Popüler bir yanlış anlayış, insanların, ellerinde yeterli veri olmadığı halde öyle olduğunu düşünmeleridir. İnsanlar yapay öğrenme ifadesiyle, mevcut veriye dayanan çok geniş çaptaki tahminleri kastederler. Oysa böyle bir şey olabilmesi için, çok fazla sayıda etiketlenmiş veriye sahip olmalısınız.
Eğer hangi ürünü hangi tüketiciye önereceğinizi tahmin etmek istiyorsanız, veriye ihtiyacınız vardır. Henüz piyasada olmayan bir ürünle bunu yapamazsınız. Çok geniş çaplı bir veri setine ihtiyacınız olur, her bir ürünü satın alan her bir insan tipi için en azından bin örnek kadar… Eğer analiz etmek istediğiniz daha fazla özellikler de varsa, bu sayı üstel olarak artar. Burada ‘özellik’ olarak kastettiğimiz şey tüketicinin yaşı ya da daha önce tıkladıkları adresler gibi şeylerdir.
Yapay öğrenmeyi işiniz için kullanmak her zaman kolaylıkla erişemeyeceğiniz kadar büyük veri setleri gerektirir; hatta bu tür veri setlerine ulaşsanız bile, bu veri, makinenin okuyabileceği bir formatta olmak zorundadır. Hillary sözlerine şöyle devam ediyor:
İnsanlar yapay öğrenmenin büyük oranda, bir algoritmada çalıştırmak üzere veriyi bir formata sokmak demek olduğunu çoğunlukla fark etmezler. Algoritmalar genelde, önceden hazırlanmış olarak mevcuttur. Birçok durumda, veriniz için en iyi doğrusal regresyon yöntemini seçmeye ihtiyacınız vardır, ancak programlamanın karmaşık süreçlerini bilmek zorunda olmazsınız. Verinizi öyle bir formata sokmalısınız ki, her satır sizin ulaşmak istediğiniz bir veri noktası olmalıdır.
Örneğin eğer algoritmanızın X müşterisini inceleyip neleri satın alıp neleri satın almadığını ortaya çıkarmak istiyorsanız “satın aldı” ve “satın almadı” için değer atamalısınız. Bu da bir sürü veri temizleme anlamına gelir. Hillary şöyle diyor:
Esas olarak, sahip olduğunuz farklı bilgi parçalarını alıp bunları bir algoritmada çalışabilecek şekilde birbirine birleştirme gibi bir yığın iş yapmalısınız.
Popüler Kültürde Yapay Öğrenmeyle İlgili En Güvenilir Referans Nedir?
Biliyoruz ki bir bilgisayar, verileri analiz edebilmek için veri temizlemenin yanı sıra, belirli özelliklere değer atanmasına ihtiyaç duyar. Bu süreç tam olarak anlaşıldığında, robot bilinci ile ilgili her türlü korku ortadan kalkmaya başlar ve Hollywood’un yol açtığı moda bakış açısının ötesini görebilmeye başlarsınız. Doğal olarak Hillary ile bundan bahsettik:
Westworld ile ilgili en büyük sorun, yani benim ‘bu artık inandırıcı olmaktan çıktı’ diye düşündüğüm nokta, Dolores ile konuştukları bir sahneydi. Bu sahnede Dolores konuşuyordu ve adam ona diyordu ki:
Dur bir dakika. Bana bunu neden söyledin?
Tüm Reklamları KapatDolores bu soruyu cevaplandırabiliyordu. Günümüzdeki en gelişmiş karmaşık mekanizma, sinir ağları ve derin öğrenmedir. Sistem içinde karşılaştığımız en büyük zorluk, “sinir ağları” ifadesini kullanmamıza karşın, düşünme şeklinin insanın düşünme şeklinden çok farklı olmasıdır. Dolores’in vermesi gereken cevap, “7” gibi bir şey, yani bir sonuca atanmış bir değer olmalıydı.
Bununla birlikte, “sinir ağları” gibi bir ibarenin neden bu kadar gündeme geldiğini anlamak kolaydır. Bu ifade, duyulduğunda anlaşılan şeyi karşılamaktadır.
Sinir ağı, sinirlerin çalışma şeklini taklit etmek üzere oluşturulan küçük yapay öğrenme algoritmaları, yani küçük lojistik regresyonlar setidir. Daha sonra bu modeller bir görevi (genelde görüntü tanıma gibi karmaşık bir şey) yerine getirebilmek için “eğitilirler”. Çok yüksek bir bilgi işleme gücü gerektirirler, ancak çok etkilidirler. Burada “sanat” olarak değerlendirilebilecek şey, hangi eğitim setinin daha kullanışlı ve hangi “nöron” konfigürasyonunun daha uygun olduğuna karar vermektir.
Peki Şu Sıralar Yapay Öğrenme Neden Bu Kadar Popüler?
“Sinir ağları”, “derin öğrenme” gibi kavramların hepsi yapay öğrenmeye girer. Yapay öğrenme de günümüzde, bir zamanlar yetişkin boyama kitaplarının sahip olduğu popülariteye sahip gibi görünüyor.
- Dış Sitelerde Paylaş
Google Eğilim verisine bakarak “yapay öğrenme” kavramının popülerliğin zirvesinde olduğunu görebilirsiniz.
Peki neden şimdi? Yapay öğrenmeye atıfta bulunan, “2001: Bir Uzay Destanı” ya da “Ex Machina” gibi bilimkurgu filmleri her zaman mevcuttu. Bu kavramın popülaritesindeki yüksek çıkışın nedeni nedir? Peki bu sadece geçici bir heves mi, yoksa geleceğe damgasını vuracak bir şey midir? Bunun cevabı basitçe, yapay öğrenmeyi şimdi gerçekleştirebiliyor olmamızdır. Hillary şunları söylüyor:
Gerçekten büyük veri setlerine ihtiyacımız olduğunu söylemiştik. Eğer her bir internet sitesindeki tüm tıklamaları takip edebilsek, bu cidden devasa büyüklükte bir veri seti demek olur. Bu türden sayım sonuçları da, daha önce hiç olmadığı kadar bilgisayarımıza indirilebilir durumda.
Şunu bir düşünün: Huffington Post gazetesinden Lauro Dambrosio’ya göre, 2016-2017 yıllarında, dünyadaki tüm verinin %90’ını ürettik. Laura’nın sözleriyle devam edelim:
NoSQL veritabanları popüler oldu, SQL hızlandı, Apache Spark gibi projeler de büyük ölçekli veri işleme performansı ve hızında harikalar yarattı. Bir anda elimizde dağ gibi veri birikti, bu da bizim için, bir sonuca ulaşmamızda faydalı olabilecek hızlı ve ucuz araç demek.
Hillary de şunları ekliyor:
Bir düşünün; bugün yapay öğrenme için gereken veri satırıyla, Excel beş yıl önce başa çıkamıyordu. Bugün bizi sınırlayan tek şey hayal gücümüz ve AWS (Amazon Web Servisi) bütçemiz.
İnsanlar Yapay Öğrenme Becerilerini Neden Öğrenmeli?
Bu durumda, yapay öğrenmeyi öğrenmeli miyiz? Forbes’a göre:
Yapay Öğrenme Mühendisleri, Veri Uzmanları ve Büyük Veri Mühendisleri LinkedIn sitesindeki yeni mesleklerde üst sıralarda yer alıyor. 2012’den bu yana, veri uzmanlarının rolü %650’den fazla arttı. Buna karşın günümüzde, ABD’de, veri bilimi yetenekleri olan 35.000 kişi var ve yüzlerce şirket bu pozisyona eleman arıyor.
Bu bilgi, LinkedIn’in ABD’deki Yeni Meslekler 2017 raporuyla da onaylandı. “Yapay Öğrenme Mühendisliği”, en hızlı büyüyen meslek olarak listelendi.
Eğer bu da yeterli değilse The New York Times’a göre geçtiğimiz dört yıl boyunca özellikle Google, Facebook, Apple, Amazon, Microsoft ve Çin firması Baidu’dan oluşan altı firma, özellikle üniversitelerden yapay zekâ yeteneklerini kapmak için bir yarış başlattılar. Bu mecrada yedi haneli maaşlar da duyulmuyor değil.
Bu spesifik alanlarda mühendislere aleni bir ihtiyaç var ve bu ihtiyaç giderek artıyor. Buna karşın, konuyla ilgili manşetlerin kaçırdığı bir noktaya ışık tutmalıyız.
Bir yüz tanıma sistemi inşa etmek ya da bir robotun duyguları tanımasını sağlamak, çok ileri seviyede bir matematik gerektirir. Ancak öğrenmek istediğiniz şey basit kümeleme (clustering) ya da regresyon yöntemlerine uygulamaya yetecek kadar yapay öğrenmeyse bu tamamen farklı bir konudur.
Ben de Hillary’ye sordum: Sana göre ben yapay öğrenme alanında anlamlı sayılabilecek ufacık bir şeye yetecek kadar programlama dilini ne kadar zamanda öğrenebilirim? Hillary şöyle yanıtladı:
Bu nasıl çalıştığına bağlı. Sanırım bunun için üniversitede bilgisayar bilimlerinde bir dönem kadar ders alman ya da altı-sekiz hafta boyunca her gün buna çalıştığın bir programa katılman gerekiyor. Eğer Python dilinde kısa bir program yazabilecek durumda değilsen veya “if (eğer)” ifadeleri ve “for (için)” döngüleri senin için bir anlam ifade etmiyorsa, daha kırk fırın ekmek yemelisin demektir. Yapay öğrenmeyi öğrenmenin temeli, kod yazmaktır.
Birçok yapay öğrenme algoritmasında kullanılan temel dil Python’dur. Python güçlü bir programlama dilidir, yeni başlayanlar için kolaydır ve iyi desteklenen bir dokümantasyonu vardır. Eğer yapay öğrenmeyi keşfetmek istiyorsanız kod yazma yeteneğiniz olup olmadığını merak ediyorsanız ya da bir kursa hazırlanıyorsanız Python kursuna bedava kayıt olabilirsiniz. Bu, size temel yetenekleri kazandırıp kod yazmanın büyülü dünyasının kapılarını açacaktır.
İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.
Soru & Cevap Platformuna Git- 38
- 15
- 11
- 8
- 7
- 4
- 4
- 1
- 1
- 0
- 0
- 0
- Çeviri Kaynağı: Code Academy | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 05/11/2024 11:05:12 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/1583
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.
This work is an exact translation of the article originally published in Code Academy. Evrim Ağacı is a popular science organization which seeks to increase scientific awareness and knowledge in Turkey, and this translation is a part of those efforts. If you are the author/owner of this article and if you choose it to be taken down, please contact us and we will immediately remove your content. Thank you for your cooperation and understanding.