Yapay Zeka ve Yaratıcılık: OpenAI Tarafından Geliştirilen Yapay Zeka DALL-E Nedir ve Neden Önemlidir?

Bu haber 4 yıl öncesine aittir. Haber güncelliğini yitirmiş olabilir; ancak arşivsel değeri ve bilimsel gelişme/ilerleme anlamındaki önemi dolayısıyla yayında tutulmaktadır. Ayrıca konuyla ilgili gelişmeler yaşandıkça bu içerik de güncellenebilir.
2021'in ilk günlerinde, başarısıyla ses getirmiş yapay zeka GPT-3'ün arkasındaki araştırma kuruluşu olan OpenAI, DALL-E adlı yeni bir yapay zeka geliştirdiğini açıkladı. GPT-3'den daha az ses getirse de, DALL-E'nin, yapay zekanın geleceği için daha da derin etkileri var. İspanyol sürrealist sanatçı Salvador Dalí ve Pixar'ın bilimkurgu robotu WALL-E'nin adının birleşimini taşıyan DALL-E, bir sanatçı kadar yaratıcı ve bir robot kadar güçlü.
Kısaca DALL-E, metin başlıklarını girdi olarak alır ve çıktı olarak orijinal görüntüler üretir.[1] Örneğin, "beşgen yeşil bir saat", "ateşten yapılmış bir küre" veya "bir binanın yan tarafındaki mavi balkabağı duvar resmi" gibi çeşitli ifadeler verildiğinde, DALL-E, şaşırtıcı derecede doğru olan görsel yorumlamalar yapabilir. Bunlarla kendiniz de oynayabilirsiniz.

DALL-E Neden Önemlidir?
Her şeyden önce bu atılım, yapay zekanın geleceğini tanımlayacak gibi görünen ve "çok yönlü yapay zeka" olarak bilinen yeni bir yapay zeka paradigmasının doğuşunu öngörüyor. Çok yönlü yapay zeka sistemleri, birden çok bilgi modeli arasında yorumlama, sentezleme ve dönüştürme yapabilir. DALL-E ise, dil ve görüntü işleme yeteneğine sahiptir. DALL-E, çok yönlü yapay zekanın ilk örneği değildir; ancak, bugüne kadarki en etkileyici olanıdır. OpenAI kurucu ortağı Ilya Sutskever bunu şöyle özetliyor:[2]
Dünya, sadece bir metinden ibaret değildir. İnsanlar sadece konuşmazlar, görürler de. Pek çok önemli bağlam, görmekten gelir.
Bugün var olan çoğu yapay zeka sistemi yalnızca 1 tür veri ile ilgilenir. NLP modelleri (örn. GPT-3) yalnızca metni işler; bilgisayarla görme modelleri (örn. yüz tanıma sistemleri) yalnızca görüntüleri işler. Bu yapay zeka modelleri, tüm bunları fazla bir çaba harcamadan başaran, insan zekasına göre çok daha az zenginlikteki bir zekayı ifade etmektedir. İnsanlarsa sürekli olarak 1 değil, 5 duyudan bilgi alır ve birleştirir. Etrafımızdaki dünyayı görme, duyma, dokunma, koku ve tat alma kombinasyonuyla anlıyoruz. Bilgileri dünyaya çeşitli yollarla geri iletiyoruz: konuşma, metin, vücut dili, yüz ifadesi, müzik. Doğal dil anlayışını, başka bir deyişle, hem "okuyabilen" hem de "görebilen" görsel temsiller üretme becerisiyle birleştiren DALL-E, çok yönlü yapay zekanın potansiyelinin güçlü bir göstergesidir.
Bu, sadece başlangıç. Önümüzdeki aylarda ve yıllarda, ses, video, konuşma, görüntüler, yazılı metinler, dokunsal geribildirim ("haptics") ve ötesinde sorunsuz bir şekilde etkileşime girebilen yapay zeka sistemleri oluşturulacaktır. Yapay zeka, gitgide daha sofistike yollarla birden fazla bilgi yöntemini birleştirmeyi öğrendikçe, dünyayı anlama ve yeni içgörüler üretme yeteneği, birleşimsel olarak patlayacaktır.
DALL-E, daha da temel bir nedenle önemlidir: Yapay zekanın yaratıcılık yeteneğine sahip olduğunu inkar etmek, gittikçe zorlaşmaktadır. DALL-E, ne Dünya'da ne de herhangi birinin hayal gücünde var olmayan görüntüler oluşturabilir. Bu tasvirler, internetteki mevcut görüntülerin basit manipülasyonları değil; zaman zaman akıllılığı ve özgünlükleriyle nefes kesen yeni yorumlardır. Bu tasvirler, DALL-E'nin insan yaratıcılarının pek çok durumda beklemediği ve tahmin edemeyeceği görüntülerdir. DALL-E'nin nefis, yaratıcı "şirin bir kase ramen emojisi" veya "avokadodan yapılmış bir penguen" çizimlerini bir düşünün.


Bu görüntüler bir insan tarafından yaratılmış olsaydı, bir an bile düşünmeden onları yaratıcı bir sürecin ürünü olarak tanımlardık. Bunları, DALL-E yaptığında, yaratıcılığın eseri olduğunu inkar edebileceğimize emin miyiz? Bu yaratıcılık kapasitesi, DALL-E'ye ürün tasarımı, moda ve mimari gibi alanlarda anında gerçek dünya ilgisi sağlar. Çok geçmeden, insan tasarımcıların DALL-E gibi bir yapay zekayı bir fikir ortağı ve ilham kaynağı olarak kullanması yaygınlaşacaktır. Örnek vermek gerekirse, "halka şekilli tatlı çörek tarzında bir koltuk" tasarlamanız istendiğinde, DALL-E, çeşitli yaratıcı seçenekler üretir. Elbette ki, bazıları diğerlerinden daha iyi tasarlanmış ve daha iyi görünebilir.

Yapay zeka algoritmaları, eğitimlerinde kullanılan veri kümelerindeki hatalar nedeniyle görüntü oluşturma konusunda zayıflama eğilimindedir. Bununla birlikte DALL-E, sadece pratik nesnelerin değil, aynı zamanda soyut kavramların da mantıklı görsel yorumlamalarını yapabilir. Örneğin, gün doğumunda bir tarladaki bir kapibarayı anlatan bir metinde, DALL-E şaşırtıcı bir şekilde, metinde özel olarak belirtilmemiş olmasına rağmen, yaptığı tasvirdeki nesnenin gölgesinin düşmesini sağlayarak veya köpeğini gezdiren, balerin eteği giymiş, havuç şeklinde bir bebek turp metni verildiğinde oluşturduğu tasvirdeki nesnelere duygu durumu bildiren yüz ifadeleri ekleyerek mantıksal akıl yürütme göstermiştir.

Hatta bir müzik aleti olan arpın, kemerli kısmını salyangoz kabuğunun eğrisiyle ilişkilendirerek arp dokulu bir salyangoz oluşturmak ve her iki unsuru da tek bir kavramda yaratıcı bir şekilde birleştirmek gibi soyut olan hayali kavramları hayata geçirmede de iyi bir muhakeme göstermiştir.

Bir mobilya tasarımcısının, DALL-E ile denemeler yaptığını, modelin ürünlerini incelediğini, metin isteminde yinelediğini ve ardından yapay zekanın tasarımlarını kendi koltuk kreasyonları için bir başlangıç noktası olarak kullandığını hayal etmek kolaydır. Benzer bir yaratıcı süreç, arabalardan aydınlatma armatürlerine, mücevherlerden evlere kadar birçok ürün için işe yarayabilir.
Yine de, DALL-E, mükemmel olmaktan henüz uzak. Oluşturduğu görüntüler, beslendiği metnin her zaman doğru temsilleri değildir: örneğin, genellikle renkleri, miktarları veya uzamsal ilişkileri yanlış alıyor. OpenAI'ın halka açık hale getirdiği DALL-E'nin çalışmalarının örnekleri, OpenAI ekibi tarafından elle seçilmemiştir, ilk olarak CLIP adı verilen başka bir görüntü işleme algoritması tarafından her başlık için 512 tanesinden yalnızca ilk 32 DALL-E tasviri derecelendirilmiş ve seçilmiştir.[3] Başka bir deyişle DALL-E, daha az etkileyici olan birçok avokado pengueni ve halka koltuk tasviri de oluşturmuştur. Buna rağmen, DALL-E'nin üretkenlik yetenekleri şaşırtıcı boyutta ve teknolojisi de hızla gelişmeye devam edecek.
Aslında maddi destek istememizin nedeni çok basit: Çünkü Evrim Ağacı, bizim tek mesleğimiz, tek gelir kaynağımız. Birçoklarının aksine bizler, sosyal medyada gördüğünüz makale ve videolarımızı hobi olarak, mesleğimizden arta kalan zamanlarda yapmıyoruz. Dolayısıyla bu işi sürdürebilmek için gelir elde etmemiz gerekiyor.
Bunda elbette ki hiçbir sakınca yok; kimin, ne şartlar altında yayın yapmayı seçtiği büyük oranda bir tercih meselesi. Ne var ki biz, eğer ana mesleklerimizi icra edecek olursak (yani kendi mesleğimiz doğrultusunda bir iş sahibi olursak) Evrim Ağacı'na zaman ayıramayacağımızı, ayakta tutamayacağımızı biliyoruz. Çünkü az sonra detaylarını vereceğimiz üzere, Evrim Ağacı sosyal medyada denk geldiğiniz makale ve videolardan çok daha büyük, kapsamlı ve aşırı zaman alan bir bilim platformu projesi. Bu nedenle bizler, meslek olarak Evrim Ağacı'nı seçtik.
Eğer hem Evrim Ağacı'ndan hayatımızı idame ettirecek, mesleklerimizi bırakmayı en azından kısmen meşrulaştıracak ve mantıklı kılacak kadar bir gelir kaynağı elde edemezsek, mecburen Evrim Ağacı'nı bırakıp, kendi mesleklerimize döneceğiz. Ama bunu istemiyoruz ve bu nedenle didiniyoruz.
Yapay zekadaki herhangi bir büyük gelişmede olduğu gibi, DALL-E kaçınılmaz olarak asırlık bir soruyu akla getiriyor: Makineler, insan seviyesinde gerçek zekaya mı yaklaşıyor? Bir yandan, DALL-E duyurusu, süper zekanın gelişiyle ilgili pek çok abartıya ilham verdi. Öte yandan, önde gelen derin öğrenme eleştirmeni Gary Marcus gibi şüpheciler, DALL-E'nin yapay zekadaki son teknolojiyi gerçekte ilerletmediğini savunuyor.
Marcus'un bakış açısı ciddiye alınmaya değer. DALL-E ve GPT-3 modellerinin arkasındaki son teknoloji trafo (transformatör) mimarisi dahil olmak üzere derin öğrenme, kavramsal bir zeka modeli olarak ciddi sınırlamalara sahip.[4]
Yine de bir bakıma bu tartışma, asıl noktayı kaçırıyor: OpenAI'ın yeni modeli "yapay genel zeka"ya doğru gerçek bir adımı temsil etse de etmese de, derin öğrenme insan bilişi kadar sağlam makine zekası için uygun bir yol olsun ya da olmasın, gerçek şu ki, DALL-E olağanüstü yeni yeteneklere sahip yeni bir araçtır. OpenAI'ın yeni yapay zeka modelleri, bilgisayar gücünde kesinti olmadan, doğrudan gerçek dünya değerine sahip olan görünürde basit görevleri yerine getirirken, genel zekanın tanınabilir unsurlarını sergileyebilen yeni makine öğrenimi sistemleri icat etmeye yönelik sektördeki en son çabaları temsil etmektedir.[5]
DALL-E ve halefleri, insan ve makine arasındaki yaratıcı ilişkide yeni olasılıkların kilidini açacaktır ve bu atılım sürecinde, muazzam bir ekonomik değer yaratacak ve yenilikçi girişimler, yeni ürünler dalgasının temelini oluşturacaktır.
Bu noktadan itibaren işler, sadece daha da şaşırtıcı olacak.
Evrim Ağacı'nda tek bir hedefimiz var: Bilimsel gerçekleri en doğru, tarafsız ve kolay anlaşılır şekilde Türkiye'ye ulaştırmak. Ancak tahmin edebileceğiniz Türkiye'de bilim anlatmak hiç kolay bir iş değil; hele ki bir yandan ekonomik bir hayatta kalma mücadelesi verirken...
O nedenle sizin desteklerinize ihtiyacımız var. Eğer yazılarımızı okuyanların %1'i bize bütçesinin elverdiği kadar destek olmayı seçseydi, bir daha tek bir reklam göstermeden Evrim Ağacı'nın bütün bilim iletişimi faaliyetlerini sürdürebilirdik. Bir düşünün: sadece %1'i...
O %1'i inşa etmemize yardım eder misiniz? Evrim Ağacı Premium üyesi olarak, ekibimizin size ve Türkiye'ye bilimi daha etkili ve profesyonel bir şekilde ulaştırmamızı mümkün kılmış olacaksınız. Ayrıca size olan minnetimizin bir ifadesi olarak, çok sayıda ayrıcalığa erişim sağlayacaksınız.
Makalelerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu makalemizle ilgili merak ettiğin bir şey mi var? Buraya tıklayarak sorabilirsin.
Soru & Cevap Platformuna Git- 15
- 11
- 8
- 6
- 5
- 4
- 4
- 3
- 0
- 0
- 0
- 0
- Türev İçerik Kaynağı: Forbes | Arşiv Bağlantısı
- ^ openai.com. Dall·e: Creating Images From Text. (5 Ocak 2021). Alındığı Tarih: 5 Ocak 2021. Alındığı Yer: OpenAI | Arşiv Bağlantısı
- ^ C. Stokel-Walker. Ai Illustrator Draws Imaginative Pictures To Go With Text Captions. (5 Ocak 2021). Alındığı Tarih: 5 Ocak 2021. Alındığı Yer: New Scientist | Arşiv Bağlantısı
- ^ OpenAI. Clip: Connecting Text And Images. (5 Ocak 2021). Alındığı Tarih: 5 Ocak 2021. Alındığı Yer: OpenAI | Arşiv Bağlantısı
- ^ G. Marcus. (2021). Deep Learning: A Critical Appraisal. arxiv.org. | Arşiv Bağlantısı
- ^ B. Walsh. A New Ai Model Draws Images From Text. (5 Ocak 2021). Alındığı Tarih: 22 Ocak 2021. Alındığı Yer: Axios | Arşiv Bağlantısı
- K. Encina. How Dall-E Uses Ai To Generate Images From Text Descriptions. (10 Ocak 2021). Alındığı Tarih: 10 Ocak 2021. Alındığı Yer: Screen Rant | Arşiv Bağlantısı
- B. Bergan. Openai's New Ai Model Can Draw Novel Images From Creative Text Prompts. (6 Ocak 2021). Alındığı Tarih: 6 Ocak 2021. Alındığı Yer: Interesting Engineering | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 21/02/2025 21:23:30 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/10005
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.