Genel Bakış: ChatGPT Nasıl Çalışır?
Eğer sadece 20 saniyeniz varsa, ChatGPT 'un nasıl çalıştığını anlatalım:
- Bir istek gönderirsiniz. "Lütfen bir e-posta yazın.
- ChatGPT girdiyi işlenmek üzere belirteçlere ayırır.
- Girdiyi analiz etmek ve bağlamı anlamak için NLP kullanır.
- Eğitim verilerinden öğrendiği kalıpları kullanarak bir sonraki kelimeyi tahmin eder.
- Girdinizin en alakalı kısımlarına odaklanır (dikkat mekanizmasını kullanarak).
- ChatGPT yanıtın tamamını kelime kelime oluşturur ve size geri gönderir.
Bunlar, ChatGPT 'un sorguları nasıl aldığına ve yanıtladığına ilişkin temel adımlardır.
GPT ne anlama geliyor?
ChatGPT 'deki GPT , 'üretken önceden eğitilmiş dönüştürücü' anlamına gelir. Bu 3 unsurun her biri ChatGPT 'nin nasıl çalıştığını anlamanın anahtarıdır.
1. Üretken
ChatGPT üretken bir yapay zeka modelidir - metin, kod, görüntü ve ses üretebilir. Üretken YZ'nin diğer örnekleri DALL-E gibi görüntü oluşturma araçları veya ses oluşturuculardır.
2. Önceden Eğitilmiş
ChatGPT 'un 'önceden eğitilmiş' yönü, internetteki her şeyi biliyor gibi görünmesinin nedenidir. GPT modeli, 'denetimsiz öğrenme' adı verilen bir süreçte geniş veri yığınları üzerinde eğitilmiştir.
ChatGPT adresinden önce, yapay zeka modelleri denetimli öğrenme ile oluşturulurdu - açıkça etiketlenmiş girdiler ve çıktılar verilir ve birini diğeriyle eşleştirmeleri öğretilirdi. Veri kümelerinin insanlar tarafından derlenmesi gerektiğinden bu süreç oldukça yavaştı.
İlk GPT modelleri, üzerinde eğitildikleri büyük veri kümelerine maruz kaldıklarında, çok çeşitli kaynaklardan gelen dil kalıplarını ve bağlamsal anlamı özümsediler.
Bu nedenle ChatGPT bir genel bilgi sohbet robotudur - halka açılmadan önce zaten büyük bir veri kümesi üzerinde eğitilmiştir.
GPT motorunu daha fazla eğitmek isteyen kullanıcılar - benzersiz kuruluşunuz için rapor yazmak gibi belirli görevlerde uzmanlaşmak için - LLMs 'u özelleştirmek için teknikler kullanabilirler.
3. Transformatör
Transformatörler, Vaswani ve arkadaşları tarafından 2017 yılında yayınlanan "Attention is All You Need" başlıklı makalede tanıtılan bir tür sinir ağı mimarisidir. Transformatörlerden önce, metin dizilerini işlemek için tekrarlayan sinir ağları (RNN'ler) ve uzun kısa süreli bellek (LSTM) ağları gibi modeller yaygın olarak kullanılıyordu.
RNN'ler ve LSTM ağları metin girdisini bir insanın yaptığı gibi sırayla okur. Ancak transformatör mimarisi, bir cümledeki her kelimeyi aynı anda işleyip değerlendirebilir ve bu da bazı kelimeleri cümlenin ortasında veya sonunda olsalar bile daha alakalı olarak puanlamasına olanak tanır. Bu, kendi kendine dikkat mekanizması olarak bilinir.
Cümleyi ele alalım: "Fare kafese sığamadı çünkü kafes çok büyüktü."
Bir transformatör 'fare' kelimesini 'kafes' kelimesinden daha önemli olarak değerlendirebilir ve cümledeki 'o' kelimesinin fareye atıfta bulunduğunu doğru bir şekilde tespit edebilir.
Ancak RNN gibi bir model, en son işlenen isim olduğu için 'it' kelimesini kafes olarak yorumlayabilir.
'Dönüştürücü' özelliği, ChatGPT 'un bağlamı daha iyi anlamasını ve öncekilere göre daha akıllı yanıtlar üretmesini sağlar.