Evrim Ağacı Logo Evrim Ağacı
Evrim Ağacı
Reklamı Kapat

Yapay Zeka ve Yaratıcılık: OpenAI Tarafından Geliştirilen Yapay Zeka DALL-E Nedir ve Neden Önemlidir?

Yapay Zeka ve Yaratıcılık: OpenAI Tarafından Geliştirilen Yapay Zeka DALL-E Nedir ve Neden Önemlidir? OpenAI
Yazar Rob Toews Çağrı Mert Bakırcı Editör Çağrı Mert Bakırcı
6 dakika
1,121 Okunma Sayısı
Notlarım
Reklamı Kapat

2021'in ilk günlerinde, başarısıyla ses getirmiş yapay zeka GPT-3'ün arkasındaki araştırma kuruluşu olan OpenAI, DALL-E adlı yeni bir yapay zeka geliştirdiğini açıkladı. GPT-3'den daha az ses getirse de, DALL-E'nin, yapay zekanın geleceği için daha da derin etkileri var. İspanyol sürrealist sanatçı Salvador Dalí ve Pixar'ın bilimkurgu robotu WALL-E'nin adının birleşimini taşıyan DALL-E, bir sanatçı kadar yaratıcı ve bir robot kadar güçlü.

Kısaca DALL-E, metin başlıklarını girdi olarak alır ve çıktı olarak orijinal görüntüler üretir.[1] Örneğin, "beşgen yeşil bir saat", "ateşten yapılmış bir küre" veya "bir binanın yan tarafındaki mavi balkabağı duvar resmi" gibi çeşitli ifadeler verildiğinde, DALL-E, şaşırtıcı derecede doğru olan görsel yorumlamalar yapabilir. Bunlarla kendiniz de oynayabilirsiniz.

OpenAI'ın derin öğrenme modeli DALL-E, bir binanın yan tarafındaki mavi balkabağı duvar resmi oluşturması istendiğinde bu orijinal tasvirleri üretmiştir.
OpenAI'ın derin öğrenme modeli DALL-E, bir binanın yan tarafındaki mavi balkabağı duvar resmi oluşturması istendiğinde bu orijinal tasvirleri üretmiştir.
OpenAI

DALL-E Neden Önemlidir?

Her şeyden önce bu atılım, yapay zekanın geleceğini tanımlayacak gibi görünen ve "çok yönlü yapay zeka" olarak bilinen yeni bir yapay zeka paradigmasının doğuşunu öngörüyor. Çok yönlü yapay zeka sistemleri, birden çok bilgi modeli arasında yorumlama, sentezleme ve dönüştürme yapabilir. DALL-E ise, dil ve görüntü işleme yeteneğine sahiptir. DALL-E, çok yönlü yapay zekanın ilk örneği değildir; ancak, bugüne kadarki en etkileyici olanıdır. OpenAI kurucu ortağı Ilya Sutskever bunu şöyle özetliyor:[2]

Dünya, sadece bir metinden ibaret değildir. İnsanlar sadece konuşmazlar, görürler de. Pek çok önemli bağlam, görmekten gelir.

Bugün var olan çoğu yapay zeka sistemi yalnızca 1 tür veri ile ilgilenir. NLP modelleri (örn. GPT-3) yalnızca metni işler; bilgisayarla görme modelleri (örn. yüz tanıma sistemleri) yalnızca görüntüleri işler. Bu yapay zeka modelleri, tüm bunları fazla bir çaba harcamadan başaran, insan zekasına göre çok daha az zenginlikteki bir zekayı ifade etmektedir. İnsanlarsa sürekli olarak 1 değil, 5 duyudan bilgi alır ve birleştirir. Etrafımızdaki dünyayı görme, duyma, dokunma, koku ve tat alma kombinasyonuyla anlıyoruz. Bilgileri dünyaya çeşitli yollarla geri iletiyoruz: konuşma, metin, vücut dili, yüz ifadesi, müzik. Doğal dil anlayışını, başka bir deyişle, hem "okuyabilen" hem de "görebilen" görsel temsiller üretme becerisiyle birleştiren DALL-E, çok yönlü yapay zekanın potansiyelinin güçlü bir göstergesidir.

Reklamı Kapat

Bu, sadece başlangıç. Önümüzdeki aylarda ve yıllarda, ses, video, konuşma, görüntüler, yazılı metinler, dokunsal geribildirim ("haptics") ve ötesinde sorunsuz bir şekilde etkileşime girebilen yapay zeka sistemleri oluşturulacaktır. Yapay zeka, gitgide daha sofistike yollarla birden fazla bilgi yöntemini birleştirmeyi öğrendikçe, dünyayı anlama ve yeni içgörüler üretme yeteneği, birleşimsel olarak patlayacaktır.

DALL-E, daha da temel bir nedenle önemlidir: Yapay zekanın yaratıcılık yeteneğine sahip olduğunu inkar etmek, gittikçe zorlaşmaktadır. DALL-E, ne Dünya'da ne de herhangi birinin hayal gücünde var olmayan görüntüler oluşturabilir. Bu tasvirler, internetteki mevcut görüntülerin basit manipülasyonları değil; zaman zaman akıllılığı ve özgünlükleriyle nefes kesen yeni yorumlardır. Bu tasvirler, DALL-E'nin insan yaratıcılarının pek çok durumda beklemediği ve tahmin edemeyeceği görüntülerdir. DALL-E'nin nefis, yaratıcı "şirin bir kase ramen emojisi" veya "avokadodan yapılmış bir penguen" çizimlerini bir düşünün.

DALL-E'den "şirin bir kase ramen emojisi" oluşturması istendiğinde verilen çıktı.
DALL-E'den "şirin bir kase ramen emojisi" oluşturması istendiğinde verilen çıktı.
OpenAI
DALL-E'den "avokadodan yapılmış bir penguen" oluşturması istendiğinde verilen çıktı.
DALL-E'den "avokadodan yapılmış bir penguen" oluşturması istendiğinde verilen çıktı.
OpenAI

Bu görüntüler bir insan tarafından yaratılmış olsaydı, bir an bile düşünmeden onları yaratıcı bir sürecin ürünü olarak tanımlardık. Bunları, DALL-E yaptığında, yaratıcılığın eseri olduğunu inkar edebileceğimize emin miyiz? Bu yaratıcılık kapasitesi, DALL-E'ye ürün tasarımı, moda ve mimari gibi alanlarda anında gerçek dünya ilgisi sağlar. Çok geçmeden, insan tasarımcıların DALL-E gibi bir yapay zekayı bir fikir ortağı ve ilham kaynağı olarak kullanması yaygınlaşacaktır. Örnek vermek gerekirse, "halka şekilli tatlı çörek tarzında bir koltuk" tasarlamanız istendiğinde, DALL-E, çeşitli yaratıcı seçenekler üretir. Elbette ki, bazıları diğerlerinden daha iyi tasarlanmış ve daha iyi görünebilir.

DALL-E'den "halka şekilli tatlı çörek tarzında bir koltuk" oluşturması istendiğinde verilen çıktı.
DALL-E'den "halka şekilli tatlı çörek tarzında bir koltuk" oluşturması istendiğinde verilen çıktı.
OpenAI

Yapay zeka algoritmaları, eğitimlerinde kullanılan veri kümelerindeki hatalar nedeniyle görüntü oluşturma konusunda zayıflama eğilimindedir. Bununla birlikte DALL-E, sadece pratik nesnelerin değil, aynı zamanda soyut kavramların da mantıklı görsel yorumlamalarını yapabilir. Örneğin, gün doğumunda bir tarladaki bir kapibarayı anlatan bir metinde, DALL-E şaşırtıcı bir şekilde, metinde özel olarak belirtilmemiş olmasına rağmen, yaptığı tasvirdeki nesnenin gölgesinin düşmesini sağlayarak veya köpeğini gezdiren, balerin eteği giymiş, havuç şeklinde bir bebek turp metni verildiğinde oluşturduğu tasvirdeki nesnelere duygu durumu bildiren yüz ifadeleri ekleyerek mantıksal akıl yürütme göstermiştir.

Evrim Ağacı'ndan Mesaj

DALL-E'den "balerin eteği giymiş, havuç şeklinde bir bebek turp" oluşturması istendiğinde verilen çıktı.
DALL-E'den "balerin eteği giymiş, havuç şeklinde bir bebek turp" oluşturması istendiğinde verilen çıktı.
OpenAI

Hatta bir müzik aleti olan arpın, kemerli kısmını salyangoz kabuğunun eğrisiyle ilişkilendirerek arp dokulu bir salyangoz oluşturmak ve her iki unsuru da tek bir kavramda yaratıcı bir şekilde birleştirmek gibi soyut olan hayali kavramları hayata geçirmede de iyi bir muhakeme göstermiştir.

DALL-E'den "arptan yapılmış salyangoz" oluşturması istendiğinde verilen çıktı.
DALL-E'den "arptan yapılmış salyangoz" oluşturması istendiğinde verilen çıktı.
OpenAI

Bir mobilya tasarımcısının, DALL-E ile denemeler yaptığını, modelin ürünlerini incelediğini, metin isteminde yinelediğini ve ardından yapay zekanın tasarımlarını kendi koltuk kreasyonları için bir başlangıç ​​noktası olarak kullandığını hayal etmek kolaydır. Benzer bir yaratıcı süreç, arabalardan aydınlatma armatürlerine, mücevherlerden evlere kadar birçok ürün için işe yarayabilir.

Yine de, DALL-E, mükemmel olmaktan henüz uzak. Oluşturduğu görüntüler, beslendiği metnin her zaman doğru temsilleri değildir: örneğin, genellikle renkleri, miktarları veya uzamsal ilişkileri yanlış alıyor. OpenAI'ın halka açık hale getirdiği DALL-E'nin çalışmalarının örnekleri, OpenAI ekibi tarafından elle seçilmemiştir, ilk olarak CLIP adı verilen başka bir görüntü işleme algoritması tarafından her başlık için 512 tanesinden yalnızca ilk 32 DALL-E tasviri derecelendirilmiş ve seçilmiştir.[3] Başka bir deyişle DALL-E, daha az etkileyici olan birçok avokado pengueni ve halka koltuk tasviri de oluşturmuştur. Buna rağmen, DALL-E'nin üretkenlik yetenekleri şaşırtıcı boyutta ve teknolojisi de hızla gelişmeye devam edecek.

Yapay zekadaki herhangi bir büyük gelişmede olduğu gibi, DALL-E kaçınılmaz olarak asırlık bir soruyu akla getiriyor: Makineler, insan seviyesinde gerçek zekaya mı yaklaşıyor? Bir yandan, DALL-E duyurusu, süper zekanın gelişiyle ilgili pek çok abartıya ilham verdi. Öte yandan, önde gelen derin öğrenme eleştirmeni Gary Marcus gibi şüpheciler, DALL-E'nin yapay zekadaki son teknolojiyi gerçekte ilerletmediğini savunuyor.

Reklamı Kapat

Marcus'un bakış açısı ciddiye alınmaya değer. DALL-E ve GPT-3 modellerinin arkasındaki son teknoloji trafo (transformatör) mimarisi dahil olmak üzere derin öğrenme, kavramsal bir zeka modeli olarak ciddi sınırlamalara sahip.[4]

Yine de bir bakıma bu tartışma, asıl noktayı kaçırıyor: OpenAI'ın yeni modeli "yapay genel zeka"ya doğru gerçek bir adımı temsil etse de etmese de, derin öğrenme insan bilişi kadar sağlam makine zekası için uygun bir yol olsun ya da olmasın, gerçek şu ki, DALL-E olağanüstü yeni yeteneklere sahip yeni bir araçtır. OpenAI'ın yeni yapay zeka modelleri, bilgisayar gücünde kesinti olmadan, doğrudan gerçek dünya değerine sahip olan görünürde basit görevleri yerine getirirken, genel zekanın tanınabilir unsurlarını sergileyebilen yeni makine öğrenimi sistemleri icat etmeye yönelik sektördeki en son çabaları temsil etmektedir.[5]

DALL-E ve halefleri, insan ve makine arasındaki yaratıcı ilişkide yeni olasılıkların kilidini açacaktır ve bu atılım sürecinde, muazzam bir ekonomik değer yaratacak ve yenilikçi girişimler, yeni ürünler dalgasının temelini oluşturacaktır.

Bu noktadan itibaren işler, sadece daha da şaşırtıcı olacak.

Okundu Olarak İşaretle
Bu İçerik Size Ne Hissettirdi?
  • Merak Uyandırıcı! 8
  • Muhteşem! 4
  • Korkutucu! 4
  • Tebrikler! 3
  • Bilim Budur! 3
  • İnanılmaz 1
  • Umut Verici! 1
  • Mmm... Çok sapyoseksüel! 0
  • Güldürdü 0
  • Üzücü! 0
  • Grrr... *@$# 0
  • İğrenç! 0
Kaynaklar ve İleri Okuma
  1. Türev İçerik Kaynağı: Forbes | Arşiv Bağlantısı
  • ^ openai.com. Dall·e: Creating Images From Text. (05 Ocak 2021). Alındığı Tarih: 05 Ocak 2021. Alındığı Yer: OpenAI | Arşiv Bağlantısı
  • ^ C. Stokel-Walker. Ai Illustrator Draws Imaginative Pictures To Go With Text Captions. (05 Ocak 2021). Alındığı Tarih: 05 Ocak 2021. Alındığı Yer: New Scientist | Arşiv Bağlantısı
  • ^ OpenAI. Clip: Connecting Text And Images. (05 Ocak 2021). Alındığı Tarih: 05 Ocak 2021. Alındığı Yer: OpenAI | Arşiv Bağlantısı
  • ^ G. Marcus. (2021). Deep Learning: A Critical Appraisal. arxiv.org. | Arşiv Bağlantısı
  • ^ B. Walsh. A New Ai Model Draws Images From Text. (05 Ocak 2021). Alındığı Tarih: 22 Ocak 2021. Alındığı Yer: Axios | Arşiv Bağlantısı
  • K. Encina. How Dall-E Uses Ai To Generate Images From Text Descriptions. (10 Ocak 2021). Alındığı Tarih: 10 Ocak 2021. Alındığı Yer: Screen Rant | Arşiv Bağlantısı
  • B. Bergan. Openai's New Ai Model Can Draw Novel Images From Creative Text Prompts. (06 Ocak 2021). Alındığı Tarih: 06 Ocak 2021. Alındığı Yer: Interesting Engineering | Arşiv Bağlantısı

Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?

Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:

kreosus.com/evrimagaci | patreon.com/evrimagaci

Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 08/03/2021 10:40:43 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/10005

İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.

Reklamı Kapat
Güncel
Karma
Agora
Mikoloji
Mikroevrim
Wuhan
Amerika Birleşik Devletleri
Sinir
Evrenin Genişlemesi
Parazit
Sağlık Personeli
Amerika
Maskeler
Öğrenme
Fosil
Dünya Dışı Yaşam
Beyin
Ağız Sağlığı
Vegan
Gerçek
Bilimkurgu
Halk Sağlığı
Koaservat
Su Ayısı
Nörobilim
İnsan Sağlığı
Araştırma
Mantık
Daha Fazla İçerik Göster
Daha Fazla İçerik Göster
Yazı Geçmişi
Okuma Geçmişi
Notlarım
İlerleme Durumunu Güncelle
Okudum
Sonra Oku
Not Ekle
Kaldığım Yeri İşaretle
Göz Attım

Evrim Ağacı tarafından otomatik olarak takip edilen işlemleri istediğin zaman durdurabilirsin.
[Site ayalarına git...]

Filtrele
Listele
Bu yazıdaki hareketlerin
Devamını Göster
Filtrele
Listele
Tüm Okuma Geçmişin
Devamını Göster
0/10000
Reklamı Kapat
Soru Sor
Not Ekle
Türkiye'deki bilimseverlerin buluşma noktasına hoşgeldiniz!

Göster

Şifrenizi mi unuttunuz? Lütfen e-posta adresinizi giriniz. E-posta adresinize şifrenizi sıfırlamak için bir bağlantı gönderilecektir.

Geri dön

Eğer aktivasyon kodunu almadıysanız lütfen e-posta adresinizi giriniz. Üyeliğinizi aktive etmek için e-posta adresinize bir bağlantı gönderilecektir.

Geri dön

Close
“Yasalar; yazıya dökülmüş olsalar bile, değişmez kurallar olarak kalmamalıdır.”
Aristoteles
Geri Bildirim Gönder
Reklamsız Deneyim

Evrim Ağacı'nın çalışmalarına Kreosus, Patreon veya YouTube üzerinden maddi destekte bulunarak hem Türkiye'de bilim anlatıcılığının gelişmesine katkı sağlayabilirsiniz, hem de site ve uygulamamızı reklamsız olarak deneyimleyebilirsiniz. Reklamsız deneyim, Evrim Ağacı'nda çeşitli kısımlarda gösterilen Google reklamlarını ve destek çağrılarını görmediğiniz, daha temiz bir site deneyimi sunmaktadır.

Kreosus

Kreosus'ta her 10₺'lik destek, 1 aylık reklamsız deneyime karşılık geliyor. Bu sayede, tek seferlik destekçilerimiz de, aylık destekçilerimiz de toplam destekleriyle doğru orantılı bir süre boyunca reklamsız deneyim elde edebiliyorlar.

Kreosus destekçilerimizin reklamsız deneyimi, destek olmaya başladıkları anda devreye girmektedir ve ek bir işleme gerek yoktur.

Patreon

Patreon destekçilerimiz, destek miktarından bağımsız olarak, Evrim Ağacı'na destek oldukları süre boyunca reklamsız deneyime erişmeyi sürdürebiliyorlar.

Patreon destekçilerimizin Patreon ile ilişkili e-posta hesapları, Evrim Ağacı'ndaki üyelik e-postaları ile birebir aynı olmalıdır. Patreon destekçilerimizin reklamsız deneyiminin devreye girmesi 24 saat alabilmektedir.

YouTube

YouTube destekçilerimizin hepsi otomatik olarak reklamsız deneyime şimdilik erişemiyorlar ve şu anda, YouTube üzerinden her destek seviyesine reklamsız deneyim ayrıcalığını sunamamaktayız. YouTube Destek Sistemi üzerinde sunulan farklı seviyelerin açıklamalarını okuyarak, hangi ayrıcalıklara erişebileceğinizi öğrenebilirsiniz.

Eğer seçtiğiniz seviye reklamsız deneyim ayrıcalığı sunuyorsa, destek olduktan sonra YouTube tarafından gösterilecek olan bağlantıdaki formu doldurarak reklamsız deneyime erişebilirsiniz. YouTube destekçilerimizin reklamsız deneyiminin devreye girmesi, formu doldurduktan sonra 24-72 saat alabilmektedir.

Diğer Platformlar

Bu 3 platform haricinde destek olan destekçilerimize ne yazık ki reklamsız deneyim ayrıcalığını sunamamaktayız. Destekleriniz sayesinde sistemlerimizi geliştirmeyi sürdürüyoruz ve umuyoruz bu ayrıcalıkları zamanla genişletebileceğiz.

Giriş yapmayı unutmayın!

Reklamsız deneyim için, maddi desteğiniz ile ilişkilendirilmiş olan Evrim Ağacı hesabınıza üye girişi yapmanız gerekmektedir. Giriş yapmadığınız takdirde reklamları görmeye devam edeceksinizdir.

Destek Ol
Takipçi UP İçerik Soru Cevap

Devamını Oku