Veri Sızıntısı
Modelin eğitim sırasında gerçek kullanımda erişemeyeceği bilgileri dolaylı ya da doğrudan öğrenmesi nedeniyle performansın yanıltıcı görünmesi durumu.
Veri sızıntısı, yapay zekâ projelerinde en sık gözden kaçan ama en tehlikeli hatalardan biridir. Basitçe söylemek gerekirse model, eğitim sırasında gerçek kullanım anında elinde olmayacak bir bilgiyi doğrudan veya dolaylı biçimde öğrenir. Sonuç olarak ölçülen performans yapay biçimde yükselir ve sistem olduğundan çok daha güçlü sanılır. Bu sızıntı bazen veri ayrımının hatalı yapılmasından, bazen hedefe çok yakın değişkenlerin modele verilmesinden, bazen de zaman boyutunun yanlış ele alınmasından kaynaklanır. Veri sızıntısı olan bir proje, teknik olarak parlak görünebilir ama canlıya çıktığında hızla çökebilir. Bu yüzden iyi değerlendirme, yalnızca metrik üretmek değil, metriklerin dürüst olup olmadığını da kontrol etmektir.
İlginizi Çekebilir
Yapay zeka yolculuğunuza devam etmek için bu kavramlara da göz atabilirsiniz.
