İçeriğe geç
Kavram SözlüğüSes, Konuşma ve Audio AI

Uçtan Uca Konuşma Tanıma

Ayrı akustik ve dil modelleri yerine tek birleşik ağ ile konuşmadan metne dönüşüm yapan yaklaşım.

Uçtan uca ASR, klasik boru hattındaki akustik model, telaffuz sözlüğü ve dil modeli ayrımını daha birleşik bir öğrenme yapısında toplar. Bu yaklaşım mimari sadelik ve büyük ölçekli veriyle öğrenme açısından avantaj sağlar. Özellikle Transformer ve transducer tabanlı yapılarla birlikte daha güçlü hale gelmiştir. Ancak bazı sektörlerde açıklanabilirlik, hata analizi ve alan özel sözcük kontrolü açısından hibrit yaklaşımlar hâlâ tercih edilebilir.