Yapay Zekâ Destekli Kulaklıklar, Kalabalıkta Odaklandığınız Kişiyi Dinleyebilmenizi Sağlıyor!
Bu haber 5 ay öncesine aittir. Haber güncelliğini yitirmiş olabilir; ancak arşivsel değeri ve bilimsel gelişme/ilerleme anlamındaki önemi dolayısıyla yayında tutulmaktadır. Ayrıca konuyla ilgili gelişmeler yaşandıkça bu içerik de güncellenebilir.
Gürültü önleyici kulaklıklar, işitsel olarak gürültüsüz bir ortam oluşturmada oldukça başarılılar. Ancak ses silme işlemi esnasında kullanıcının bulunduğu ortamdan gelen belirli seslere izin verilmesi araştırmacıları hâlâ zorluyor. Örneğin Apple'ın AirPods Pro'sunun en son sürümü, kullanıcılar için ses seviyelerini otomatik olarak ayarlıyor (örneğin ne zaman sohbet ettiklerini algılıyor), ancak kullanıcının kimi dinleyeceği veya bunun ne zaman olacağı konusunda çok az kontrolü var.
Washington Üniversitesi'nden bir ekip, kulaklık takan bir kullanıcının konuşan bir kişiye sadece üç ila beş saniye boyunca bakarak bu kişinin sesini işleme almasını sağlayan bir yapay zekâ sistemi geliştirdi. "Hedef Konuşmayı İşitme" adı verilen sistem, hedef kişiyi kaydettikten sonra ortamdaki diğer tüm sesleri iptal ediyor ve dinleyici gürültülü bir ortamda bulunsa ve artık konuşmacıyla yüz yüze olmasa bile kayıtlı konuşmacının sesini gerçek zamanlı olarak kulaklık aracılığıyla aktarmaya devam ediyor.
Ekip bulgularını 14 Mayıs'ta Honolulu'da düzenlenen ACM CHI Bilgisayar Sistemlerinde İnsan Faktörleri Konferansı'nda sundu. Kavram kanıtlayıcı cihazın kodu başkalarının da geliştirebilmesi için açık kaynak olarak mevcut. Ancak sistem ticari olarak piyasaya sürülmedi. Paul G. Allen Bilgisayar Bilimi ve Mühendisliği Okulu'nda UW profesörü olan kıdemli yazar Shyam Gollakota bu konuda şöyle diyor:
Şu an için yapay zekâyı soruları yanıtlayan web tabanlı sohbet robotları olarak düşünme eğilimdeyiz. Ancak bu projede, kulaklık takan herkesin işitsel algısını tercihleri doğrultusunda değiştirmek için bir yapay zekâ geliştiriyoruz. Cihazlarımız sayesinde artık birçok kişinin konuştuğu gürültülü bir ortamda olsanız bile tek bir konuşmacıyı net bir şekilde duyabileceksiniz.
Sistemi kullanmak için, mikrofonlarla donatılmış hazır kulaklıklar takan kişi kafasını konuşan birine doğrultarak bir düğmeye basıyor. Hedef konuşmacının sesinden çıkan ses dalgaları, kulaklığın her iki tarafındaki mikrofonlara aynı anda ulaşmalı, ancak bu kısımda 16 derecelik bir hata payı var.
Ses dalgaları mikrofonlara eş zamanlı olarak ulaştıktan ve algılandıktan sonra, kulaklıklar bu sinyali yerleşik bir bilgisayara gönderiyor ve burada ekibin makine öğrenimi yazılımı, hedef konuşmacının ses kalıplarını öğreniyor. Sistem, konuşmacının sesini yakalıyor ve ikili farklı ortamlarda hareket etmeye devam ederken bile bu sesi dinleyiciye vermeye devam ediyor. Sistemin ilgili sese odaklanma yeteneği, konuşmacı konuşmaya devam ettikçe gelişerek sisteme daha fazla eğitim verisi sağlıyor ve deneyimi iyileştirmeye de devam ediyor.
Ekip, sistemi 21 denek üzerinde test etti. Katılımcılar, seçili konuşmacının sesinin netliğinin ortalama olarak filtrelenmemiş bir sesin neredeyse iki katı kadar yüksek olduğunu belirtti. Bu çalışma, ekibin kullanıcıların duymak istedikleri belirli ses sınıflarını (kuşlar veya sesler gibi) seçmelerine ve ortamdaki diğer sesleri iptal etmelerine olanak tanıyan önceki "anlamsal işitme" (İng: "semantic hearing") araştırmasını temel alarak yeni bulguları üzerine koyuyor.
Şu anda Hedef Konuşmayı İşitme sistemi aynı anda yalnızca bir konuşmacıya odaklanabiliyor ve yalnızca hedef konuşmacının sesiyle aynı yönden gelen başka bir yüksek ses olmadığında çalışıyor. Kullanıcı ses kalitesinden memnun değilse netliği artırmak için hoparlörde başka bir seçim denenebiliyor. Ekip, gelecekte sistemi kulaklıklara ve işitme cihazlarına da entegre edebilmek için çalışıyor.
İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.
Soru & Cevap Platformuna Git- 1
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- K. Leswing. Apple’s New Airpods Won’t Have To Be Taken Out Of Your Ears As Often, Thanks To Sophisticated Ai. (18 Eylül 2023). Alındığı Tarih: 2 Haziran 2024. Alındığı Yer: CNBC | Arşiv Bağlantısı
- S. Milne. New Ai Noise-Canceling Headphone Technology Lets Wearers Pick Which Sounds They Hear. (9 Kasım 2023). Alındığı Tarih: 2 Haziran 2024. Alındığı Yer: University of Washington | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 17/11/2024 13:46:03 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/17778
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.