Sesli bir asistan nasıl yapılır?

296 görüntülenme

Cevap Ver

1 Cevap

Soruyu Soranın Seçtiği Cevap

Mehmet Emre Demir

217.9K UP

Araştırma, tecrübe 30 Eylül 2023

Sesli asistan yazmak için gereken şeyleri birkaç alt dala ayırabiliriz.

Ses Verisini Yazıya Dönüştürme

Öncelikle kullanıcının gönderdiği ve uygulamadan yapmasını istediği şeyleri anlatan ses verisini yazıya dönüştürmen lazım. Bu iş için Google Speech-to-Text, Microsoft Azure Speech Service ve Amazon Transcribe gibi servisleri kullanabilirsin.

Doğal Dil İşleme(NLP)

Kullanıcının sesli olarak göndereceği talimatları doğru bir şekilde anlamak ve cevap vermek için bir NLP(Natural Language Processing - Doğal Dil İşleme) algoritmasına ihtiyacın var. Bu tarz bir algoritma yazmak hiç kolay bir iş değil. Koca koca şirketler bu algoritmalara yıllarını harcıyorlar. O yüzden bana göre şimdilik en doğru olanı Google Cloud Natural Language Processing, ChatGPT veya spaCy gibi hazır algoritmalardan birini kullanmak olacaktır

Cevabı Sese Dönüştürmek

Şimdi sıra geldi NLP ile aldığımız cevabı sese dönüştürmeye. Burada da Google Text-to-Speech, Microsoft Azure Text to Speech ve Amazon Polly gibi servisleri kullanabilirsin.

Dış Arayüz

Aynı zamanda kullanıcının etkileşime geçeceği bir dış arayüz geliştirmen lazım. Kullanıcı bu dış arayüz üzerinden ses verisini gönderecek, bu ses verisine NLP tarafından verilen cevap bu arayüzde görüntülenecek. Burada sesli asistanını yayınlamak istediğin platforma göre farklı programlama dilleri(örneğin Android işletim sistemi için Kotlin, IOS işletim sistemi için Swift, Windows için C#) öğrenip bu dilleri kullanarak dış arayüzünü yazabilirsin.

Fark ettiysen çoğu yerde hazır yazılımlar kullanmanı önerdim. Bunun sebebi burada anlattığım şeyleri kendi başına yapmanın çok zor olması. Yukarıda bahsettiğim algoritmalara şirketler büyük ekiplerle yıllarını harcıyorlar. Bu algoritmaları sıfırdan kendi başına yazman çok zor ve aynı zamanda çok uzun bir süreç olacaktır. Dolayısıyla işin algoritma tarafını hazır algoritmalar ile çözmek en doğrusu olacaktır.

Bu cevap, soru sahibi tarafından en iyi cevap seçilmiştir. Ancak bu, cevabın doğru olduğunu garanti etmez.

Daha Fazla Cevap Göster

Cevap Ver

Evrim Ağacı Soru & Cevap Platformu, Türkiye'deki bilimseverler tarafından kolektif ve öz denetime dayalı bir şekilde sürdürülen, özgür bir ortamdır. Evrim Ağacı tarafından yayınlanan makalelerin aksine, bu platforma girilen soru ve cevapların içeriği veya gerçek/doğru olup olmadıkları Evrim Ağacı yönetimi tarafından denetlenmemektedir. Evrim Ağacı, bu platformda yayınlanan cevapları herhangi bir şekilde desteklememekte veya doğruluğunu garanti etmemektedir. Doğru olmadığını düşündüğünüz cevapları, size sunulan denetim araçlarıyla işaretleyebilir, daha doğru olan cevapları kaynaklarıyla girebilir ve oylama araçlarıyla platformun daha güvenilir bir ortama evrimleşmesine katkı sağlayabilirsiniz.

Popüler Yazılar

30 gün

90 gün

1 yıl

Evrim Ağacı'na Destek Ol

Evrim Ağacı'nın %100 okur destekli bir bilim platformu olduğunu biliyor muydunuz? Evrim Ağacı'nın maddi destekçileri arasına katılarak Türkiye'de bilimin yayılmasına güç katın.

Evrim Ağacı'nı Takip Et!

Sesli bir asistan nasıl yapılır?

Ses Verisini Yazıya Dönüştürme

Doğal Dil İşleme(NLP)

Cevabı Sese Dönüştürmek

Dış Arayüz

Bize Ulaşın