İçeriğe geç
Kavram SözlüğüÜretken Yapay Zekâ ve LLM

Speculative Decoding

Küçük hızlı modelin önerilerini büyük modelle doğrulayarak üretim hızını artıran decoding yaklaşımı.

Speculative decoding, LLM üretim gecikmesini azaltmak için geliştirilen yenilikçi inference tekniklerinden biridir. Küçük model birkaç token önerir, büyük model ise bunları toplu biçimde kabul veya red eder. Doğru tasarlandığında kaliteyi büyük ölçüde korurken anlamlı hız kazanımı sağlayabilir.