Yapay Zeka, 5000 Yıllık Akadca Çivi Yazısı Tabletleri Anında Çevirmeyi Başardı!
Bu haber 7 ay öncesine aittir. Haber güncelliğini yitirmiş olabilir; ancak arşivsel değeri ve bilimsel gelişme/ilerleme anlamındaki önemi dolayısıyla yayında tutulmaktadır. Ayrıca konuyla ilgili gelişmeler yaşandıkça bu içerik de güncellenebilir.
Çeviri, sadece bir kelimeyi başka bir dilde karşılığı olan kelimeyle değiştirmek değildir. Yüksek kaliteli bir çeviri, çevirmenin her iki dilin düşünceleri nasıl bir araya getirdiğini anlamasını ve daha sonra bu bilgiyi orijinal dilin dilsel nüanslarını koruyan ve ana dili İngilizce olanların zahmetsizce anlayabileceği bir çeviri oluşturmak için kullanmasını gerektirir.
Bu süreç ne kadar zor olsa da, eski bir dili modern bir dile çevirmenin zorluğuyla kıyaslanamaz bile! Bu çevirmenler yalnızca yazılı kaynaklardan yok olmuş dilleri diriltmekle kalmamalıdır; aynı zamanda bu kaynakları üreten kültürlerin yüzyıllar içinde nasıl evrim geçirdiğine dair yakın bilgi sahibi olmalıdır. Bu da yetmezmiş gibi, çevirmeleri gereken kaynaklar çoğu zaman parçalanmıştır ve önemli bağlamlar da çağlar boyunca kaybolmuştur.
Bu nedenle, antik dilleri tercüme edebilecek kişi sayısı azdır ve bu kişilerin en iyi çabaları, arkeologlar tarafından ortaya çıkarılan metinlerin hacmi karşısında çoğu zaman yetersiz kalmaktadır.
Antik Akadca'yı ele alalım. Bu erken Sami dili, antik dünyadaki diller arasından en iyi bilinenlerindendir. Yüz binlerce, bazılarına göre bir milyondan fazla Akadca metin keşfedilmiştir ve bunlar, bugün müzelerde ve üniversitelerde bulunmaktadır. Hatta birçoğu çevrimiçi olarak dijitalleştirilmiştir. Her biri bize ilk uygarlıkların yaşamı, siyaseti ve inançları hakkında bir şeyler öğretme potansiyeline sahip olsa da, bu bilgi, onları tercüme etmek için gereken zaman ve insan gücünün ardında kilitli kalmıştır.
Arkeologlar ve bilgisayar bilimcilerinden oluşan multidisipliner bir ekip, bu durumu değiştirmeye yardımcı olmak için Akadcayı neredeyse anında tercüme edebilen ve bu 5.000 yıllık tabletlerde korunan tarihi kayıtların kilidini açabilen bir yapay zeka geliştirdi.
Akadca: Kayboldu ve Bulundu!
Akadca, kurucusu Büyük Sargon'un fetihleriyle M.Ö. 2300 civarında ortaya çıkan Akad İmparatorluğu'nun ana diliydi. Konuşulan bir dil olarak Akadca, M.Ö. birinci binyılın başlarında yerini tamamen Aramiceye bırakmadan önce, Asur ve Babil lehçelerine bölünecekti. Bugünse mirasını devam ettirecek yavru dilleri bile olmayan, gerçek anlamıyla yok olmuş bir dildir.
Ancak bir yazı dili olarak Akadca daha kalıcı olmuştur. İmparatorluk, selefi olan Sümer uygarlığının çivi yazısını ödünç almıştır. Bu yazı sistemi, kama şeklindeki glifleri fırınlamadan önce ıslak kil tabletlere yazdırmak için kamış bir kalem kullanıyordu (Latince'de "kama şeklinde" anlamına gelen "cuniform", yani "çivi yazısı" adı da buradan gelmektedir). Aramicenin, bölgenin ortak dili haline gelmesi ve Akadcanın yerini almasından sonra bile, dönemin akademisyenleri MS birinci yüzyıla kadar Akadca çivi yazısıyla yazmaya devam ettiler - öyle görünüyor ki, antik çağda bile akademisyenler ve bilim insanları inanılmaz derecede inatçıydılar.
Bu geleneksel zihniyetin modern arkeologlar için de istenmeyen bir faydası oldu: Çivi yazısı papirüs üzerine de yazılabilecek olsa bile, daha çok kil ya da taş üzerine yazılırdı. Bu malzemeler, diğer yazı ortamlarını harap eden yangınlara ve sellere çok daha iyi dayanır. Zaman, her şey değiştirse de, arkeologlar nadiren kusursuza yakın durumda çivi yazılı tabletleri keşfederler. Bu, Akad yazısının tarihi kayıtlarda bu kadar iyi kanıtlanabilmesinin bir nedenidir. Dilbilimci Steven Roger Fischer, A History of Writing (Yazının Tarihi) başlıklı kitabında şöyle yazıyor:
İronik bir şekilde, yıkıcı yangınlar eski Mezopotamya'nın en büyük kütüphanelerinden bazılarını yıkamamıştır; çünkü bunlar kilden yapılmıştır. Buna karşılık, eski Mısır'ın papirüs kütüphanelerinin tamamı yanmış ya da toz haline gelmiştir, ancak birçok kodeks günümüze ulaşmıştır.
Böylesi dilbilimsel zenginliklere sahip olsalar bile, bu antik kütüphaneleri doğru bir şekilde tercüme etmek hiç de kolay değildir. Daha önce bahsedilen zorlukların ötesinde, Akad dili "polivalan", yani "çokdeğerli"dir (İng: "polyvalent"). Bir diğer deyişle çivi yazısı işaretleri, her birinin bir cümle içinde nasıl işlev gördüğüne bağlı olarak birkaç farklı okumaya sahip olabilir. Dilin böyle gelişmesinin pek çok nedeni vardır, ancak Fischer'e göre Akadların hiçbir zaman sadeleşmemelerinin bir nedeni "geleneklere ve kendi kendilerine dayattıkları verimliliğe bağlı görünmeleridir". Bu geleneksel zihniyet, Sümerceden çok farklı bir dil olmasına rağmen Sümer yazısını kullanmaya devam etmelerine yol açmıştır. (Tarih bilimi söz konusu olduğunda, bazı noktalarda kazanırsınız, bazılarında kaybedersiniz).
Bu nedenle, Akadcayı çevirmek iki aşamalı bir süreçtir. İlk olarak, akademisyenler çivi yazısı işaretlerini transliterasyondan geçirmelidir. Yani, çivi yazısını alırlar ve hedef dilin kulağa benzer gelen fonetiğini kullanarak yeniden yazarlar. Çoğu okuyucunun aşina olacağı bir örnek, İngilizceye "Tanrı" olarak çevrilen ancak "Allah" olarak çevrilen Arapça الله kelimesidir. Bu harf çevirisi, Latin alfabesinin kelimeyi Arapçada duyulduğu gibi üretmeye en yakın olduğu harf çevirisidir. Akademisyenler daha sonra metnin transliterasyonunu alır ve modern bir dile çevirir.
Anında Sonuçlar Veren Süperhızlı Yapay Zeka
Tahmin edebileceğiniz gibi, bu uzun ve zahmetli bir süreçtir. Bu işi iyi yapmayı öğrenmek için yıllarca eğitim ve özveri gerekir. Araştırma ekibi, işleri hızlandırmaya yardımcı olmak için, Akad çivi yazısını çevirmek için, Google Translate'in kaputunun altındaki teknolojinin aynısı olan bir nöral makine çevirisi modeli geliştirdi.
Aslında maddi destek istememizin nedeni çok basit: Çünkü Evrim Ağacı, bizim tek mesleğimiz, tek gelir kaynağımız. Birçoklarının aksine bizler, sosyal medyada gördüğünüz makale ve videolarımızı hobi olarak, mesleğimizden arta kalan zamanlarda yapmıyoruz. Dolayısıyla bu işi sürdürebilmek için gelir elde etmemiz gerekiyor.
Bunda elbette ki hiçbir sakınca yok; kimin, ne şartlar altında yayın yapmayı seçtiği büyük oranda bir tercih meselesi. Ne var ki biz, eğer ana mesleklerimizi icra edecek olursak (yani kendi mesleğimiz doğrultusunda bir iş sahibi olursak) Evrim Ağacı'na zaman ayıramayacağımızı, ayakta tutamayacağımızı biliyoruz. Çünkü az sonra detaylarını vereceğimiz üzere, Evrim Ağacı sosyal medyada denk geldiğiniz makale ve videolardan çok daha büyük, kapsamlı ve aşırı zaman alan bir bilim platformu projesi. Bu nedenle bizler, meslek olarak Evrim Ağacı'nı seçtik.
Eğer hem Evrim Ağacı'ndan hayatımızı idame ettirecek, mesleklerimizi bırakmayı en azından kısmen meşrulaştıracak ve mantıklı kılacak kadar bir gelir kaynağı elde edemezsek, mecburen Evrim Ağacı'nı bırakıp, kendi mesleklerimize döneceğiz. Ama bunu istemiyoruz ve bu nedenle didiniyoruz.
Ekip, yapay zeka modelini Open Richly Annotated Cuneiform Corpus'tan bir çivi yazısı metin örneği üzerinde eğitti ve ona iki farklı şekilde çeviri yapmayı öğretti. İlk olarak, yapay zeka modeli orijinal metinlerin transliterasyonlarından Akadcayı çevirmeyi öğrendi. Ayrıca çivi yazısı sembollerini doğrudan nasıl çevireceğini de öğrendi. Daha spesifik olarak, orijinal bir tabletin görüntüsünden otomatik olarak Unicode üreten başka bir zaman kazandıran araç tarafından oluşturulan çivi yazısı metinlerinin Unicode gliflerini çevirdi.
Yapay zeka modelinin daha sonra, örneğin edebi eserler ve idari mektuplar arasındaki fark gibi çeşitli türlerin nüanslarını nasıl ele alacağını ve çivi yazısının kullanıldığı binlerce yıl boyunca görülen değişiklikleri nasıl ele alacağını bulması gerekiyordu. Yapay zeka modeli daha sonra makine çevirisi metinleri değerlendirmek için kullanılan bir algoritma olan "iki dilli değerlendirme yedeği"nin 4. versiyonunu (BLEU4) kullanılarak test edildi.
Ekibin yapay zeka modeli, harf çevirisinden İngilizceye yapılan testte 37,47 puan aldı. Çivi yazısından İngilizceye testinde ise 36,52 puan aldı. Her iki puan da hedef taban çizgisinin üzerinde ve yüksek kaliteli bir çeviri aralığındaydı. Ve şaşırtıcı bir sonuç vardı: Model, her bir test cümlesinin türünün nüanslarını yeniden üretebildi. Araştırmacıların hedeflerinden biri bu olmasa da, çalışmada bunun çevirinin ötesinde kullanım olanakları yaratabileceğini belirtiyorlar:
[Çeviri] uygun olsun ya da olmasın, neredeyse her durumda tür tanınabilir. Gelecek için umut verici bir senaryo, [modelin] kullanıcıya çevirilerini dayandırdıkları kaynakların bir listesini göstermesidir ki bu da özellikle bilimsel amaçlar için faydalı olacaktır.
Ekip sonuçlarını hakemli PNAS Nexus dergisinde yayınladı.[1] Ayrıca araştırmalarını ve kaynak kodlarını GitHub'da Akkademia adı altında yayınladılar.
Geçmişin Geleceği Daha Parlak Görünüyor!
İlk sonuçlar ne kadar umut verici olsa da hala yapılması gereken işler var. Her iki durumda da model, test cümlelerinin bazılarını yanlış çevirdi. Ve diğer yapay zeka modelleri gibi, bu model de halüsinasyon görmeye yatkın; yani verdiği yanıtın kaynakla bazen hiçbir bağlantısı olmayabiliyor. Bir örnekte, insan çevirmen "Neden davayı Libbi-Ali'den bir adamın önünde (de) yürütmeliyiz?" cümlesini üretti. Yapay zekanın çevirisiyse: "Onlar İç Şehir'de İç Şehir'deler." (Fark edebileceğiniz gibi bu çeviri, "birazcık" yanlış!).
Sonuç olarak görünen o ki yapay zeka modeli kısa ve orta uzunluktaki cümleleri çevirirken en iyi sonucu veriyor. Ayrıca kraliyet kararnameleri ve idari kayıtlar gibi daha kalıplaşmış türlerde, mitler, ilahiler ve kehanetler gibi edebi türlere göre daha iyi sonuç veriyor. Araştırmacılar, daha büyük bir veri kümesi üzerinde daha fazla eğitimle, doğruluğunu artırmayı hedeflediklerini belirtiyor. Zamanla, yapay zeka modellerinin insan akademisyenler için sanal bir asistan görevi görebileceğini umuyorlar. Yapay zeka ham çeviriyi hızlı bir şekilde sağlayabilirken, bilim insanı da tarihi diller, kültürler ve insanlar hakkındaki bilgisiyle bunu geliştirebilir. Son olarak, şöyle yazıyorlar:
Çivi yazısıyla yazılmış yüz binlerce kil tablet, antik Mezopotamya'nın siyasi, sosyal, ekonomik ve bilimsel tarihini belgeliyor. Ancak bu belgelerin çoğu, sayılarının çokluğu ve bunları okuyabilecek uzman sayısının sınırlı olması nedeniyle çevrilmemiş ve erişilemez durumda. Bu çalışma, antik Mezopotamya'nın kültürel mirasının korunması ve yaygınlaştırılması yolunda atılmış önemli bir adımdır.
İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.
Soru & Cevap Platformuna Git- 18
- 3
- 2
- 1
- 1
- 1
- 0
- 0
- 0
- 0
- 0
- 0
- Çeviri Kaynağı: Big Think | Arşiv Bağlantısı
- ^ G. Gutherz, et al. (2023). Translating Akkadian To English With Neural Machine Translation. PNAS Nexus. doi: 10.1093/pnasnexus/pgad096. | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 21/12/2024 19:41:05 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/17601
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.
This work is an exact translation of the article originally published in Big Think. Evrim Ağacı is a popular science organization which seeks to increase scientific awareness and knowledge in Turkey, and this translation is a part of those efforts. If you are the author/owner of this article and if you choose it to be taken down, please contact us and we will immediately remove your content. Thank you for your cooperation and understanding.