İçeriğe geç
Kavram SözlüğüSes, Konuşma ve Audio AI

Vocoder

Akustik temsil veya spektral özelliklerden işitilebilir ses dalgası üreten temel sentez bileşeni.

Vocoder, TTS zincirinde metinden doğrudan değil, ara akustik temsillerden nihai ses üretimini gerçekleştiren kritik bileşendir. Mel-spectrogram gibi ara yapılar, vocoder tarafından gerçek dalga formuna dönüştürülür. Bu aşamanın kalitesi, sentezlenen sesin doğal duyulup duyulmamasında belirleyici rol oynar. Modern neural vocoder'lar, insan benzeri ses kalitesine ulaşmada önemli kırılma noktalarından biridir.