İçeriğe geç

Veri Sızıntısı Önleme

Model eğitimi sırasında gerçek kullanım anında bulunmayacak bilginin öğrenmeye sızmasını engelleyen ön işleme disiplini.

Veri sızıntısı önleme, veri ön işleme ve modelleme süreçlerinde en kritik mühendislik disiplinlerinden biridir. Train-test ayrımından önce yapılan ölçekleme, hedefe çok yakın türetilmiş değişkenler veya zaman sonrasına ait bilgi kullanımı sızıntı üretir. Bu tür hatalar modeli olduğundan çok daha güçlü gösterir. Güçlü leakage prevention yaklaşımı, dönüşüm adımlarının pipeline içinde doğru sırada uygulanmasını ve zaman mantığının sıkı korunmasını gerektirir. Sağlam modelleme, iyi algoritmadan önce dürüst veri akışı tasarımı ister.