Kavram SözlüğüSes, Konuşma ve Audio AI
Mel Spektrogram
Ses sinyalini insan işitme algısına daha yakın frekans ölçeğinde zaman-frekans temsiline dönüştüren yapı.
Mel spektrogram, modern speech ve audio AI sistemlerinde en yaygın kullanılan ara temsillerden biridir. Ham ses dalga formunu daha öğrenilebilir ve akustik açıdan anlamlı bir yüzeye taşır. ASR, TTS, duygu analizi ve ses sınıflandırma gibi çok sayıda görev bu temsil üzerine kurulur. Zaman ve frekans bilgisi arasında pratik bir denge sunar.
İlginizi Çekebilir
Yapay zeka yolculuğunuza devam etmek için bu kavramlara da göz atabilirsiniz.
