İçeriğe geç
Kavram SözlüğüSes, Konuşma ve Audio AI

Maske Tabanlı Konuşma İyileştirme

Zaman-frekans temsili üzerinde konuşma bileşenlerini koruyup gürültüyü bastırmak için maske tahmini yapan yaklaşım.

Maske tabanlı konuşma iyileştirme, modern speech enhancement sistemlerinde yaygın olarak kullanılan güçlü bir çerçevedir. Sistem, spektrogramdaki hangi bölgelerin konuşmaya hangi bölgelerin gürültüye ait olduğunu tahmin etmeye çalışır. Bu yaklaşım özellikle ASR öncesi temizleme ve düşük SNR ortamlarında belirgin kalite artışı sağlayabilir.