İçeriğe geç

Gradyan Kırpma

Aşırı büyük gradyanların eğitim sürecini bozmasını engellemek için gradyan büyüklüğünü sınırlayan teknik.

Gradyan kırpma, özellikle derin ve sıralı ağlarda patlayan gradyan problemini kontrol altına almak için kullanılır. Eğer gradyan değerleri aşırı büyürse, parametre güncellemeleri kararsız hale gelir ve model eğitimi bozulabilir. Clipping, bu değerleri belirli bir sınır içinde tutarak daha kontrollü öğrenme sağlar. RNN’ler, transformer eğitimi ve büyük ölçekli derin öğrenme deneylerinde sık kullanılan bir güvenlik mekanizmasıdır. Bu teknik, optimizasyonun yalnızca hız değil, stabilite meselesi olduğunu da gösterir.