İçeriğe geç
Kavram SözlüğüSes, Konuşma ve Audio AI

Konuşmacı Kümeleme

Benzer ses segmentlerini aynı konuşmacıya ait olacak biçimde gruplandıran diarization alt görevi.

Konuşmacı kümeleme, diarization sistemlerinde segmentlerin gerçek konuşmacı kimliklerine yaklaşmasını sağlar. Ses embedding'leri kullanılarak akustik benzerlik yapısı çıkarılır ve segmentler kümelenir. Bu aşama başarısız olursa aynı kişi birden fazla kimlik altında dağılabilir veya farklı kişiler tek kimlikte birleşebilir. Ses analitiği kalitesinin temel karar noktalarından biridir.