İçeriğe geç
Kavram SözlüğüÜretken Yapay Zekâ ve LLM

INT4 Nicemleme

Modeli 4 bit hassasiyet düzeyine indirerek çok daha düşük bellek maliyeti sağlayan agresif nicemleme yaklaşımı.

INT4 nicemleme, özellikle büyük modelleri daha küçük donanımlarda çalıştırmak için çok önemlidir. Bellek maliyetini ciddi biçimde düşürür ancak görev duyarlılığına bağlı olarak kalite kaybı riski taşır. Bu nedenle düşük bit nicemlemede kalibrasyon ve dikkatli benchmark değerlendirmesi kritik hale gelir.