Yapay Zeka ve Yaratıcılık: OpenAI Tarafından Geliştirilen Yapay Zeka DALL-E Nedir ve Neden Önemlidir?
Bu haber 3 yıl öncesine aittir. Haber güncelliğini yitirmiş olabilir; ancak arşivsel değeri ve bilimsel gelişme/ilerleme anlamındaki önemi dolayısıyla yayında tutulmaktadır. Ayrıca konuyla ilgili gelişmeler yaşandıkça bu içerik de güncellenebilir.
2021'in ilk günlerinde, başarısıyla ses getirmiş yapay zeka GPT-3'ün arkasındaki araştırma kuruluşu olan OpenAI, DALL-E adlı yeni bir yapay zeka geliştirdiğini açıkladı. GPT-3'den daha az ses getirse de, DALL-E'nin, yapay zekanın geleceği için daha da derin etkileri var. İspanyol sürrealist sanatçı Salvador Dalí ve Pixar'ın bilimkurgu robotu WALL-E'nin adının birleşimini taşıyan DALL-E, bir sanatçı kadar yaratıcı ve bir robot kadar güçlü.
Kısaca DALL-E, metin başlıklarını girdi olarak alır ve çıktı olarak orijinal görüntüler üretir.[1] Örneğin, "beşgen yeşil bir saat", "ateşten yapılmış bir küre" veya "bir binanın yan tarafındaki mavi balkabağı duvar resmi" gibi çeşitli ifadeler verildiğinde, DALL-E, şaşırtıcı derecede doğru olan görsel yorumlamalar yapabilir. Bunlarla kendiniz de oynayabilirsiniz.
DALL-E Neden Önemlidir?
Her şeyden önce bu atılım, yapay zekanın geleceğini tanımlayacak gibi görünen ve "çok yönlü yapay zeka" olarak bilinen yeni bir yapay zeka paradigmasının doğuşunu öngörüyor. Çok yönlü yapay zeka sistemleri, birden çok bilgi modeli arasında yorumlama, sentezleme ve dönüştürme yapabilir. DALL-E ise, dil ve görüntü işleme yeteneğine sahiptir. DALL-E, çok yönlü yapay zekanın ilk örneği değildir; ancak, bugüne kadarki en etkileyici olanıdır. OpenAI kurucu ortağı Ilya Sutskever bunu şöyle özetliyor:[2]
Dünya, sadece bir metinden ibaret değildir. İnsanlar sadece konuşmazlar, görürler de. Pek çok önemli bağlam, görmekten gelir.
Bugün var olan çoğu yapay zeka sistemi yalnızca 1 tür veri ile ilgilenir. NLP modelleri (örn. GPT-3) yalnızca metni işler; bilgisayarla görme modelleri (örn. yüz tanıma sistemleri) yalnızca görüntüleri işler. Bu yapay zeka modelleri, tüm bunları fazla bir çaba harcamadan başaran, insan zekasına göre çok daha az zenginlikteki bir zekayı ifade etmektedir. İnsanlarsa sürekli olarak 1 değil, 5 duyudan bilgi alır ve birleştirir. Etrafımızdaki dünyayı görme, duyma, dokunma, koku ve tat alma kombinasyonuyla anlıyoruz. Bilgileri dünyaya çeşitli yollarla geri iletiyoruz: konuşma, metin, vücut dili, yüz ifadesi, müzik. Doğal dil anlayışını, başka bir deyişle, hem "okuyabilen" hem de "görebilen" görsel temsiller üretme becerisiyle birleştiren DALL-E, çok yönlü yapay zekanın potansiyelinin güçlü bir göstergesidir.
Bu, sadece başlangıç. Önümüzdeki aylarda ve yıllarda, ses, video, konuşma, görüntüler, yazılı metinler, dokunsal geribildirim ("haptics") ve ötesinde sorunsuz bir şekilde etkileşime girebilen yapay zeka sistemleri oluşturulacaktır. Yapay zeka, gitgide daha sofistike yollarla birden fazla bilgi yöntemini birleştirmeyi öğrendikçe, dünyayı anlama ve yeni içgörüler üretme yeteneği, birleşimsel olarak patlayacaktır.
DALL-E, daha da temel bir nedenle önemlidir: Yapay zekanın yaratıcılık yeteneğine sahip olduğunu inkar etmek, gittikçe zorlaşmaktadır. DALL-E, ne Dünya'da ne de herhangi birinin hayal gücünde var olmayan görüntüler oluşturabilir. Bu tasvirler, internetteki mevcut görüntülerin basit manipülasyonları değil; zaman zaman akıllılığı ve özgünlükleriyle nefes kesen yeni yorumlardır. Bu tasvirler, DALL-E'nin insan yaratıcılarının pek çok durumda beklemediği ve tahmin edemeyeceği görüntülerdir. DALL-E'nin nefis, yaratıcı "şirin bir kase ramen emojisi" veya "avokadodan yapılmış bir penguen" çizimlerini bir düşünün.
Bu görüntüler bir insan tarafından yaratılmış olsaydı, bir an bile düşünmeden onları yaratıcı bir sürecin ürünü olarak tanımlardık. Bunları, DALL-E yaptığında, yaratıcılığın eseri olduğunu inkar edebileceğimize emin miyiz? Bu yaratıcılık kapasitesi, DALL-E'ye ürün tasarımı, moda ve mimari gibi alanlarda anında gerçek dünya ilgisi sağlar. Çok geçmeden, insan tasarımcıların DALL-E gibi bir yapay zekayı bir fikir ortağı ve ilham kaynağı olarak kullanması yaygınlaşacaktır. Örnek vermek gerekirse, "halka şekilli tatlı çörek tarzında bir koltuk" tasarlamanız istendiğinde, DALL-E, çeşitli yaratıcı seçenekler üretir. Elbette ki, bazıları diğerlerinden daha iyi tasarlanmış ve daha iyi görünebilir.
Yapay zeka algoritmaları, eğitimlerinde kullanılan veri kümelerindeki hatalar nedeniyle görüntü oluşturma konusunda zayıflama eğilimindedir. Bununla birlikte DALL-E, sadece pratik nesnelerin değil, aynı zamanda soyut kavramların da mantıklı görsel yorumlamalarını yapabilir. Örneğin, gün doğumunda bir tarladaki bir kapibarayı anlatan bir metinde, DALL-E şaşırtıcı bir şekilde, metinde özel olarak belirtilmemiş olmasına rağmen, yaptığı tasvirdeki nesnenin gölgesinin düşmesini sağlayarak veya köpeğini gezdiren, balerin eteği giymiş, havuç şeklinde bir bebek turp metni verildiğinde oluşturduğu tasvirdeki nesnelere duygu durumu bildiren yüz ifadeleri ekleyerek mantıksal akıl yürütme göstermiştir.
- OpenAI, GPT-4o İsimli Yeni Modelini Tanıttı! Anlık Diyaloglar, Anlık Çeviri, Anlık Video Analizi ve Çok Daha Fazlası!
- IBM Watson, Doktorların 160 Saatte Belirlediği Kanser Tedavi Programını 10 Dakikada Hazırlayabiliyor!
- Bir Algoritma, İnsanlığın En İkonik Şarkısını Seçti: Smells Like Teen Spirit - Nirvana
Hatta bir müzik aleti olan arpın, kemerli kısmını salyangoz kabuğunun eğrisiyle ilişkilendirerek arp dokulu bir salyangoz oluşturmak ve her iki unsuru da tek bir kavramda yaratıcı bir şekilde birleştirmek gibi soyut olan hayali kavramları hayata geçirmede de iyi bir muhakeme göstermiştir.
Bir mobilya tasarımcısının, DALL-E ile denemeler yaptığını, modelin ürünlerini incelediğini, metin isteminde yinelediğini ve ardından yapay zekanın tasarımlarını kendi koltuk kreasyonları için bir başlangıç noktası olarak kullandığını hayal etmek kolaydır. Benzer bir yaratıcı süreç, arabalardan aydınlatma armatürlerine, mücevherlerden evlere kadar birçok ürün için işe yarayabilir.
Yine de, DALL-E, mükemmel olmaktan henüz uzak. Oluşturduğu görüntüler, beslendiği metnin her zaman doğru temsilleri değildir: örneğin, genellikle renkleri, miktarları veya uzamsal ilişkileri yanlış alıyor. OpenAI'ın halka açık hale getirdiği DALL-E'nin çalışmalarının örnekleri, OpenAI ekibi tarafından elle seçilmemiştir, ilk olarak CLIP adı verilen başka bir görüntü işleme algoritması tarafından her başlık için 512 tanesinden yalnızca ilk 32 DALL-E tasviri derecelendirilmiş ve seçilmiştir.[3] Başka bir deyişle DALL-E, daha az etkileyici olan birçok avokado pengueni ve halka koltuk tasviri de oluşturmuştur. Buna rağmen, DALL-E'nin üretkenlik yetenekleri şaşırtıcı boyutta ve teknolojisi de hızla gelişmeye devam edecek.
Evrim Ağacı'nın çalışmalarına Kreosus, Patreon veya YouTube üzerinden maddi destekte bulunarak hem Türkiye'de bilim anlatıcılığının gelişmesine katkı sağlayabilirsiniz, hem de site ve uygulamamızı reklamsız olarak deneyimleyebilirsiniz. Reklamsız deneyim, sitemizin/uygulamamızın çeşitli kısımlarda gösterilen Google reklamlarını ve destek çağrılarını görmediğiniz, %100 reklamsız ve çok daha temiz bir site deneyimi sunmaktadır.
KreosusKreosus'ta her 10₺'lik destek, 1 aylık reklamsız deneyime karşılık geliyor. Bu sayede, tek seferlik destekçilerimiz de, aylık destekçilerimiz de toplam destekleriyle doğru orantılı bir süre boyunca reklamsız deneyim elde edebiliyorlar.
Kreosus destekçilerimizin reklamsız deneyimi, destek olmaya başladıkları anda devreye girmektedir ve ek bir işleme gerek yoktur.
PatreonPatreon destekçilerimiz, destek miktarından bağımsız olarak, Evrim Ağacı'na destek oldukları süre boyunca reklamsız deneyime erişmeyi sürdürebiliyorlar.
Patreon destekçilerimizin Patreon ile ilişkili e-posta hesapları, Evrim Ağacı'ndaki üyelik e-postaları ile birebir aynı olmalıdır. Patreon destekçilerimizin reklamsız deneyiminin devreye girmesi 24 saat alabilmektedir.
YouTubeYouTube destekçilerimizin hepsi otomatik olarak reklamsız deneyime şimdilik erişemiyorlar ve şu anda, YouTube üzerinden her destek seviyesine reklamsız deneyim ayrıcalığını sunamamaktayız. YouTube Destek Sistemi üzerinde sunulan farklı seviyelerin açıklamalarını okuyarak, hangi ayrıcalıklara erişebileceğinizi öğrenebilirsiniz.
Eğer seçtiğiniz seviye reklamsız deneyim ayrıcalığı sunuyorsa, destek olduktan sonra YouTube tarafından gösterilecek olan bağlantıdaki formu doldurarak reklamsız deneyime erişebilirsiniz. YouTube destekçilerimizin reklamsız deneyiminin devreye girmesi, formu doldurduktan sonra 24-72 saat alabilmektedir.
Diğer PlatformlarBu 3 platform haricinde destek olan destekçilerimize ne yazık ki reklamsız deneyim ayrıcalığını sunamamaktayız. Destekleriniz sayesinde sistemlerimizi geliştirmeyi sürdürüyoruz ve umuyoruz bu ayrıcalıkları zamanla genişletebileceğiz.
Giriş yapmayı unutmayın!Reklamsız deneyim için, maddi desteğiniz ile ilişkilendirilmiş olan Evrim Ağacı hesabınıza üye girişi yapmanız gerekmektedir. Giriş yapmadığınız takdirde reklamları görmeye devam edeceksinizdir.
Yapay zekadaki herhangi bir büyük gelişmede olduğu gibi, DALL-E kaçınılmaz olarak asırlık bir soruyu akla getiriyor: Makineler, insan seviyesinde gerçek zekaya mı yaklaşıyor? Bir yandan, DALL-E duyurusu, süper zekanın gelişiyle ilgili pek çok abartıya ilham verdi. Öte yandan, önde gelen derin öğrenme eleştirmeni Gary Marcus gibi şüpheciler, DALL-E'nin yapay zekadaki son teknolojiyi gerçekte ilerletmediğini savunuyor.
Marcus'un bakış açısı ciddiye alınmaya değer. DALL-E ve GPT-3 modellerinin arkasındaki son teknoloji trafo (transformatör) mimarisi dahil olmak üzere derin öğrenme, kavramsal bir zeka modeli olarak ciddi sınırlamalara sahip.[4]
Yine de bir bakıma bu tartışma, asıl noktayı kaçırıyor: OpenAI'ın yeni modeli "yapay genel zeka"ya doğru gerçek bir adımı temsil etse de etmese de, derin öğrenme insan bilişi kadar sağlam makine zekası için uygun bir yol olsun ya da olmasın, gerçek şu ki, DALL-E olağanüstü yeni yeteneklere sahip yeni bir araçtır. OpenAI'ın yeni yapay zeka modelleri, bilgisayar gücünde kesinti olmadan, doğrudan gerçek dünya değerine sahip olan görünürde basit görevleri yerine getirirken, genel zekanın tanınabilir unsurlarını sergileyebilen yeni makine öğrenimi sistemleri icat etmeye yönelik sektördeki en son çabaları temsil etmektedir.[5]
DALL-E ve halefleri, insan ve makine arasındaki yaratıcı ilişkide yeni olasılıkların kilidini açacaktır ve bu atılım sürecinde, muazzam bir ekonomik değer yaratacak ve yenilikçi girişimler, yeni ürünler dalgasının temelini oluşturacaktır.
Bu noktadan itibaren işler, sadece daha da şaşırtıcı olacak.
İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.
Soru & Cevap Platformuna Git- 15
- 11
- 8
- 6
- 5
- 4
- 4
- 3
- 0
- 0
- 0
- 0
- Türev İçerik Kaynağı: Forbes | Arşiv Bağlantısı
- ^ openai.com. Dall·e: Creating Images From Text. (5 Ocak 2021). Alındığı Tarih: 5 Ocak 2021. Alındığı Yer: OpenAI | Arşiv Bağlantısı
- ^ C. Stokel-Walker. Ai Illustrator Draws Imaginative Pictures To Go With Text Captions. (5 Ocak 2021). Alındığı Tarih: 5 Ocak 2021. Alındığı Yer: New Scientist | Arşiv Bağlantısı
- ^ OpenAI. Clip: Connecting Text And Images. (5 Ocak 2021). Alındığı Tarih: 5 Ocak 2021. Alındığı Yer: OpenAI | Arşiv Bağlantısı
- ^ G. Marcus. (2021). Deep Learning: A Critical Appraisal. arxiv.org. | Arşiv Bağlantısı
- ^ B. Walsh. A New Ai Model Draws Images From Text. (5 Ocak 2021). Alındığı Tarih: 22 Ocak 2021. Alındığı Yer: Axios | Arşiv Bağlantısı
- K. Encina. How Dall-E Uses Ai To Generate Images From Text Descriptions. (10 Ocak 2021). Alındığı Tarih: 10 Ocak 2021. Alındığı Yer: Screen Rant | Arşiv Bağlantısı
- B. Bergan. Openai's New Ai Model Can Draw Novel Images From Creative Text Prompts. (6 Ocak 2021). Alındığı Tarih: 6 Ocak 2021. Alındığı Yer: Interesting Engineering | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 18/12/2024 14:59:22 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/10005
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.