Yapay Zekâ Destekli Kulaklıklar, Kalabalıkta Odaklandığınız Kişiyi Dinleyebilmenizi Sağlıyor!

3 Haziran 2024

2 dakika

703

Yapay Zekâ Destekli Kulaklıklar, Kalabalıkta Odaklandığınız Kişiyi Dinleyebilmenizi Sağlıyor!

Evrim Ağacı'ndan bir yeni mesajın var.

Bilimi Yaymamıza Yardım Edin! 😍

Her ay milyonlarca bilimsever Evrim Ağacı'na uğruyor ve karmaşık bilimsel konuları basit bir dille anlattığımız içeriklerimizden faydalanıyor. Ne yazık ki bu okurlarımızın %0.1'inden azı bize destek olmayı seçiyor. Halbuki okurlarımızın sadece %1'i bile Evrim Ağacı'na ayda 39₺ gibi erişilebilir bir miktarla destek olsaydı, bilimi Türkiye geneline yaymamız önünde hiçbir maddi engel kalmazdı! Siz de destekçilerimiz arasına şimdi katılarak, bilimin gücüne güç katın! Daha Fazla...

Ayrıca Maddi Destekçi rozetine sahip olacaksın!

Bilime Destek Ol!

Tarihi Geçmiş Haber

Bu haber 1 yıl öncesine aittir. Haber güncelliğini yitirmiş olabilir; ancak arşivsel değeri ve bilimsel gelişme/ilerleme anlamındaki önemi dolayısıyla yayında tutulmaktadır. Ayrıca konuyla ilgili gelişmeler yaşandıkça bu içerik de güncellenebilir.

Gürültü önleyici kulaklıklar, işitsel olarak gürültüsüz bir ortam oluşturmada oldukça başarılılar. Ancak ses silme işlemi esnasında kullanıcının bulunduğu ortamdan gelen belirli seslere izin verilmesi araştırmacıları hâlâ zorluyor. Örneğin Apple'ın AirPods Pro'sunun en son sürümü, kullanıcılar için ses seviyelerini otomatik olarak ayarlıyor (örneğin ne zaman sohbet ettiklerini algılıyor), ancak kullanıcının kimi dinleyeceği veya bunun ne zaman olacağı konusunda çok az kontrolü var.

Washington Üniversitesi'nden bir ekip, kulaklık takan bir kullanıcının konuşan bir kişiye sadece üç ila beş saniye boyunca bakarak bu kişinin sesini işleme almasını sağlayan bir yapay zekâ sistemi geliştirdi. "Hedef Konuşmayı İşitme" adı verilen sistem, hedef kişiyi kaydettikten sonra ortamdaki diğer tüm sesleri iptal ediyor ve dinleyici gürültülü bir ortamda bulunsa ve artık konuşmacıyla yüz yüze olmasa bile kayıtlı konuşmacının sesini gerçek zamanlı olarak kulaklık aracılığıyla aktarmaya devam ediyor.

Ekip bulgularını 14 Mayıs'ta Honolulu'da düzenlenen ACM CHI Bilgisayar Sistemlerinde İnsan Faktörleri Konferansı'nda sundu. Kavram kanıtlayıcı cihazın kodu başkalarının da geliştirebilmesi için açık kaynak olarak mevcut. Ancak sistem ticari olarak piyasaya sürülmedi. Paul G. Allen Bilgisayar Bilimi ve Mühendisliği Okulu'nda UW profesörü olan kıdemli yazar Shyam Gollakota bu konuda şöyle diyor:

Şu an için yapay zekâyı soruları yanıtlayan web tabanlı sohbet robotları olarak düşünme eğilimdeyiz. Ancak bu projede, kulaklık takan herkesin işitsel algısını tercihleri doğrultusunda değiştirmek için bir yapay zekâ geliştiriyoruz. Cihazlarımız sayesinde artık birçok kişinin konuştuğu gürültülü bir ortamda olsanız bile tek bir konuşmacıyı net bir şekilde duyabileceksiniz.

Sistemi kullanmak için, mikrofonlarla donatılmış hazır kulaklıklar takan kişi kafasını konuşan birine doğrultarak bir düğmeye basıyor. Hedef konuşmacının sesinden çıkan ses dalgaları, kulaklığın her iki tarafındaki mikrofonlara aynı anda ulaşmalı, ancak bu kısımda 16 derecelik bir hata payı var.

Ses dalgaları mikrofonlara eş zamanlı olarak ulaştıktan ve algılandıktan sonra, kulaklıklar bu sinyali yerleşik bir bilgisayara gönderiyor ve burada ekibin makine öğrenimi yazılımı, hedef konuşmacının ses kalıplarını öğreniyor. Sistem, konuşmacının sesini yakalıyor ve ikili farklı ortamlarda hareket etmeye devam ederken bile bu sesi dinleyiciye vermeye devam ediyor. Sistemin ilgili sese odaklanma yeteneği, konuşmacı konuşmaya devam ettikçe gelişerek sisteme daha fazla eğitim verisi sağlıyor ve deneyimi iyileştirmeye de devam ediyor.

Ekip, sistemi 21 denek üzerinde test etti. Katılımcılar, seçili konuşmacının sesinin netliğinin ortalama olarak filtrelenmemiş bir sesin neredeyse iki katı kadar yüksek olduğunu belirtti. Bu çalışma, ekibin kullanıcıların duymak istedikleri belirli ses sınıflarını (kuşlar veya sesler gibi) seçmelerine ve ortamdaki diğer sesleri iptal etmelerine olanak tanıyan önceki "anlamsal işitme" (İng: "semantic hearing") araştırmasını temel alarak yeni bulguları üzerine koyuyor.

Şu anda Hedef Konuşmayı İşitme sistemi aynı anda yalnızca bir konuşmacıya odaklanabiliyor ve yalnızca hedef konuşmacının sesiyle aynı yönden gelen başka bir yüksek ses olmadığında çalışıyor. Kullanıcı ses kalitesinden memnun değilse netliği artırmak için hoparlörde başka bir seçim denenebiliyor. Ekip, gelecekte sistemi kulaklıklara ve işitme cihazlarına da entegre edebilmek için çalışıyor.

Evrim Ağacı, sizlerin sayesinde bağımsız bir bilim iletişim platformu olmaya devam edecek!

Evrim Ağacı'nda tek bir hedefimiz var: Bilimsel gerçekleri en doğru, tarafsız ve kolay anlaşılır şekilde Türkiye'ye ulaştırmak. Ancak tahmin edebileceğiniz gibi Türkiye'de bilim anlatmak hiç kolay bir iş değil; hele ki bir yandan ekonomik bir hayatta kalma mücadelesi verirken...

O nedenle sizin desteklerinize ihtiyacımız var. Eğer yazılarımızı okuyanların %1'i bize bütçesinin elverdiği kadar destek olmayı seçseydi, bir daha tek bir reklam göstermeden Evrim Ağacı'nın bütün bilim iletişimi faaliyetlerini sürdürebilirdik. Bir düşünün: sadece %1'i...

O %1'i inşa etmemize yardım eder misiniz? Evrim Ağacı Premium üyesi olarak, ekibimizin size ve Türkiye'ye bilimi daha etkili ve profesyonel bir şekilde ulaştırmamızı mümkün kılmış olacaksınız. Ayrıca size olan minnetimizin bir ifadesi olarak, çok sayıda ayrıcalığa erişim sağlayacaksınız.

Avantajlarımız

"Maddi Destekçi" Rozeti

Reklamsız Deneyim

%10 Daha Fazla UP Kazanımı

Özel İçeriklere Erişim

+5 Quiz Oluşturma Hakkı

Özel Profil Görünümü

+1 İçerik Boostlama Hakkı

ve Daha Fazlası İçin...

Aylık

Tek Sefer

₺50/Aylık

₺100/Aylık

₺150/Aylık

₺250/Aylık

₺500/Aylık

Destek Ol

₺50/Aylık

Bu Makaleyi Alıntıla

Okundu Olarak İşaretle

Paylaş

Sonra Oku

Notlarım

Yazdır / PDF Olarak Kaydet

Bize Ulaş

Yukarı Zıpla

Rastgele Yazıya Git

Feragatname: Evrim Ağacı, doğrudan üniversiteler, akademik dergiler veya resmi bilim kurumları tarafından yayınlanan bu basın açıklamalarını temel editöryal düzenlemeden geçirmektedir; ancak açıklamaların isabetliliğinden sorumlu değildir. Basın açıklaması konusundaki sorularınızı aşağıdaki medya irtibat kişisine yöneltebilirsiniz.

Medya İrtibat

[email protected]
University of Washington

Makalelerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!

Bu makalemizle ilgili merak ettiğin bir şey mi var? Buraya tıklayarak sorabilirsin.

Soru & Cevap Platformuna Git

Bu Makale Sana Ne Hissettirdi?

Kaynaklar ve İleri Okuma

K. Leswing. Apple’s New Airpods Won’t Have To Be Taken Out Of Your Ears As Often, Thanks To Sophisticated Ai. (18 Eylül 2023). Alındığı Tarih: 2 Haziran 2024. Alındığı Yer: CNBC | Arşiv Bağlantısı
S. Milne. New Ai Noise-Canceling Headphone Technology Lets Wearers Pick Which Sounds They Hear. (9 Kasım 2023). Alındığı Tarih: 2 Haziran 2024. Alındığı Yer: University of Washington | Arşiv Bağlantısı

Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?

Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:

kreosus.com/evrimagaci | patreon.com/evrimagaci

Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 01/12/2025 01:18:26 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/17778

İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.

Kategoriler ve Etiketler

Tümünü Göster

Yapay Zekâ Destekli Kulaklıklar, Kalabalıkta Odaklandığınız Kişiyi Dinleyebilmenizi Sağlıyor!

Bize Ulaşın