İçeriğe geç
Kavram SözlüğüÜretken Yapay Zekâ ve LLM

INT8 Nicemleme

Ağırlık ve bazen aktivasyonları 8 bit düzeyine indirerek dengeli verimlilik ve kalite sunan yaygın nicemleme biçimi.

INT8 nicemleme, genellikle kalite kaybı ile verimlilik arasında iyi bir orta nokta sunar. Birçok donanım platformu için uygun destek bulunması nedeniyle yaygın biçimde kullanılır. Özellikle üretim inference sistemlerinde bellek kazanımı ve hız artışı açısından pratik değeri yüksektir.