tag SesTanıma

Bu sayfada SesTanıma etiketi ile işaretlenmiş tüm yapay zeka kavramlarını inceliyorsunuz.

hearing

Keyword Spotting (Anahtar Kelime Algılama)

Keyword Spotting (Anahtar Kelime Algılama), sürekli dinleme yapan bir ses tanıma alt dalı olup belirli bir tetikleyici kelime ya da ifadeyi gerçek zamanlı olarak tespit etmek amacıyla kullanılır. "Hey Siri", "OK Google" ve "Alexa" gibi uyandırma sözcükleri (wake word) en bilinen örnekleridir; ancak uygulama alanı bunların çok ötesine geçer. Keyword Spotting sistemleri, her zaman açık (always-on) bir dinleme döngüsünde son derece düşük güç tüketerek çalışır. Bu özellik, akıllı hoparlörler, giyilebilir cihazlar, akıllı telefonlar ve mikrodenetleyiciler gibi kaynak kısıtlı platformlarda kullanılmasını mümkün kılar. Sistem, belirli bir kelime ya da ifade tespit edildiğinde büyük bir konuşma tanıma motorunu ya da başka bir süreci tetikler. Teknik açıdan bakıldığında, modern Keyword Spotting modelleri Evrişimli Sinir Ağı (CNN), Yinelemeli Sinir Ağı (RNN) veya hafif Transformer tabanlı mimariler kullanır. DS-CNN (Depthwise Separable CNN) ve TC-ResNet gibi modeller, yüksek doğruluk oranlarını küçük bellek ayak izleriyle birleştirir; bu modeller genellikle 50KB ile 1MB arasında yer kaplar. Bu sayede pil ömrü kritik olan giyilebilir cihazlarda bile sürekli çalışabilirler. Gizlilik açısından değerlendirildiğinde, cihaz üzerinde (on-device) çalışan Keyword Spotting, ses verisinin buluta gönderilmesini gerektirmediğinden kullanıcı mahremiyetini korur. Yalnızca tetikleyici kelime tanındığında daha kapsamlı bir işlem süreci başlatılabilir. Bu tasarım hem gecikmeyi minimize eder hem de bant genişliği tüketimini azaltır. Google Speech Commands, Mozilla Common Voice ve LibriSpeech gibi açık kaynak veri setleri bu alanda araştırma ve geliştirmeye büyük katkı sağlamıştır. Eğitim aşamasında Yanlış Kabul Oranı (False Accept Rate — FAR) ve Yanlış Red Oranı (False Reject Rate — FRR) arasındaki denge, sistemin kullanılabilirliği açısından kritik bir performans ölçütü olarak öne çıkar.

arrow_forward