# Overfitting (Aşırı Öğrenme) Nedir? Genelleme ve Regularizasyon Rehberi > Source: https://sukruyusufkaya.com/blog/overfitting-nedir > Updated: 2026-07-05T16:05:37.571Z > Type: blog > Category: yapay-zeka **TLDR:** Overfitting nedir? Overfitting (aşırı öğrenme), bir makine öğrenmesi modelinin eğitim verisini ezberleyip yeni veride başarısız olması durumudur. Bu rehber: net tanım, overfitting nasıl anlaşılır, underfitting ile farkı, regularizasyon, cross validation, genelleme, gerçek dünya örnekleri ve sık sorulan sorular. Overfitting nedir? Overfitting (aşırı öğrenme), bir makine öğrenmesi modelinin eğitim verisindeki gürültü ve tesadüfi ayrıntıları da ezberleyerek eğitim setinde çok yüksek başarı gösterip daha önce görmediği yeni veride belirgin biçimde başarısız olması durumudur. Kısacası model, veriyi öğrenmek yerine ezberler ve genelleme yeteneğini kaybeder. Bir modelin amacı, gördüğü örneklerden yola çıkıp daha önce hiç görmediği durumlarda doğru tahmin yapabilmektir. Overfitting tam da bu amacı sabote eder: model eğitim sorularının cevaplarını ezberlemiş ama konuyu anlamamış bir öğrenci gibi davranır. Bu rehber overfitting nedir, nasıl anlaşılır, underfitting ile farkı nedir ve regularizasyon ile cross validation kullanarak nasıl önlenir sorularını uzman düzeyinde ele alıyor. ## Overfitting Neden Bu Kadar Önemli? Overfitting, makine öğrenmesinin en temel ve en yaygın başarısızlık biçimidir. Bir modelin laboratuvarda etkileyici sonuçlar verip gerçek dünyada çökmesinin bir numaralı nedeni budur. Çünkü eğitim setindeki yüksek başarı yanıltıcıdır: model, o veriyi zaten "görmüş" olduğu için iyi performans gösterir, ama işin gerçek sınavı görmediği veridedir. Bu, yalnızca akademik bir kaygı değildir. Bir bankanın kredi risk modeli, bir hastanenin tanı destek sistemi ya da bir e-ticaret sitesinin öneri motoru overfitting yaşarsa, geliştirme ortamında mükemmel görünüp canlıya alındığında yanlış kararlar üretir. Modelin gerçek değeri, ezberlediği veride değil, hiç görmediği veride ne kadar isabetli olduğunda, yani genelleme performansındadır. Bu nedenle her ciddi makine öğrenmesi projesinde overfitting'i ölçmek ve yönetmek zorunludur. ## Overfitting Nasıl Anlaşılır? Overfitting'i tespit etmenin en pratik yolu, veriyi baştan bölmektir: eğitim (train), doğrulama (validation) ve test setleri. Model yalnızca eğitim setinde öğrenir; doğrulama ve test setleri, modelin daha önce görmediği veriyi temsil eder. Overfitting'in klasik imzası burada ortaya çıkar. İşaret nettir: eğitim başarısı ile test başarısı arasında büyük bir uçurum varsa, model overfitting yaşıyordur. Örneğin eğitimde %99, testte %72 doğruluk, modelin veriyi anlamak yerine ezberlediğinin göstergesidir. Eğitim boyunca doğrulama hatasının bir noktadan sonra düşmeyi bırakıp tekrar yükselmeye başlaması da klasik bir overfitting sinyalidir. Bu ayrımı görebilmek için tek bir test seti yerine cross validation kullanmak, ölçümü çok daha güvenilir kılar. ## Overfitting ile Underfitting Arasındaki Fark Nedir? Overfitting'i doğru anlamak için karşıt ucuyla, underfitting (yetersiz öğrenme) ile birlikte düşünmek gerekir. Bu ikisi, model karmaşıklığı ekseninin iki zıt hatasıdır. Overfitting fazla karmaşıklıktan doğar: model o kadar esnektir ki eğitim verisindeki her tesadüfi dalgalanmayı bile öğrenir. Underfitting ise yetersiz karmaşıklıktan doğar: model gerçek örüntüyü yakalayamayacak kadar basittir. Underfitting yaşayan bir model hem eğitimde hem testte kötüdür, çünkü veriyi hiç öğrenememiştir. Overfitting yaşayan model ise eğitimde çok iyi, testte kötüdür. Aradaki ideal nokta, modelin gerçek örüntüyü öğrenip gürültüyü öğrenmediği dengedir; bu dengeye "bias-variance dengesi" denir. Underfitting yüksek yanlılık (bias), overfitting yüksek varyans (variance) demektir. İyi bir model, bu ikisini birlikte düşük tutarak sağlam bir genelleme kurar. Bir modelin "iyi" olup olmadığını yalnızca eğitim skoruna bakarak asla anlayamazsınız. Kritik olan eğitim ile test başarısı arasındaki farktır. Fark küçükse model genelliyordur; fark büyükse, eğitim skoru ne kadar yüksek olursa olsun, elinizde overfitting vardır. ## Overfitting Neden Oluşur? Başlıca Nedenler Overfitting rastgele ortaya çıkmaz; birkaç tanınabilir kökü vardır. Bunları bilmek, çareyi de belirler. - **Yetersiz veri:** Az sayıda örnek, modelin gerçek örüntü ile tesadüfi gürültüyü ayırt etmesini zorlaştırır; model kolayca ezberler. - **Aşırı karmaşık model:** Veri miktarına göre fazla parametreli bir model, öğrenecek gerçek örüntüden fazla kapasiteye sahip olduğu için gürültüyü de öğrenir. - **Çok uzun eğitim:** Model eğitim verisi üzerinde gereğinden fazla döndürülürse, genel örüntüyü öğrendikten sonra ayrıntıları ezberlemeye başlar. - **Gürültülü veya taraflı veri:** Hatalı etiketler ve kuruma özgü tesadüfi düzenler, modelin yanlış şeyleri öğrenmesine yol açar. - **Veri sızıntısı (data leakage):** Test bilgisinin eğitime karışması, yapay biçimde yüksek başarı yaratır ve gerçek overfitting'i gizler. Bu nedenlerin ortak paydası şudur: model, veriyi açıklayan genel kuralı öğrenmek yerine, elindeki örneklere özgü ayrıntıları öğrenir. Overfitting'i önlemek, tam da modeli bu ayrıntılardan uzaklaştırıp genel kurala yöneltmektir. ## Regularizasyon ile Overfitting Nasıl Azaltılır? Overfitting'e karşı en güçlü araç setinin başında regularizasyon gelir. Regularizasyon, modelin aşırı karmaşık, uç ağırlıklar öğrenmesini cezalandırarak onu daha basit ve daha düzgün çözümlere doğru iter. Fikir basittir: basit açıklamalar, karmaşık açıklamalardan daha iyi genelleme yapma eğilimindedir. En yaygın regularizasyon biçimleri şunlardır: L2 regularizasyon (ridge) ağırlıkları küçülterek modeli yumuşatır; L1 regularizasyon (lasso) bazı ağırlıkları sıfıra çekerek gereksiz öznitelikleri eler; dropout ise sinir ağlarında her adımda rastgele nöronları devre dışı bırakarak modelin belirli yollara aşırı bağımlı olmasını engeller. Bunlara ek olarak erken durdurma (early stopping) ve veri artırma da pratikte birer regularizasyon etkisi yaratır. Doğru dozda regularizasyon, modeli gürültüden koparıp gerçek örüntüye odaklar; aşırısı ise underfitting'e yol açar, bu yüzden denge şarttır. ## Cross Validation ve Genelleme Ölçümü Overfitting'i yönetmenin ilk adımı onu güvenilir biçimde ölçmektir; bunun standardı da cross validation'dır. Tek bir eğitim/test bölünmesi şanslı ya da şanssız olabilir: modeliniz sadece o özel bölünmede iyi görünüyor olabilir. Cross validation bu riski ortadan kaldırır. En yaygın biçim olan k-katlı (k-fold) cross validation'da veri k eşit parçaya bölünür; model her turda k-1 parçada eğitilip kalan bir parçada test edilir ve bu k kez tekrarlanır. Sonuçta modelin başarısı tek bir bölünmeye değil, verinin tamamına yayılmış bir ortalamaya dayanır. Katmanlar arasında başarı çok oynuyorsa veya ortalama test başarısı eğitimden çok düşükse, bu güçlü bir overfitting işaretidir. Böylece cross validation, hem overfitting'i tespit eden hem de farklı çözümleri adil biçimde karşılaştıran temel araçtır. Genelleme, sonuçta bir modelin gerçek dünya değerinin tek gerçek ölçütüdür. ## Gerçek Dünya ve Sektör Örnekleri Overfitting soyut bir laboratuvar sorunu değildir; her sektörde somut zararlar üretir. Bir bankada, yalnızca son birkaç yılın verisiyle eğitilmiş bir kredi skorlama modeli, o dönemin ekonomik koşullarını ezberleyebilir; koşullar değiştiğinde tahminleri hızla bozulur. Bir perakende zincirinde, geçmiş kampanya verisini aşırı öğrenen bir talep tahmini modeli, yeni bir kampanyada tümüyle yanılabilir. Sağlıkta risk daha da yüksektir: dar bir hasta grubundan toplanan görüntülerle eğitilen bir tanı modeli, o hastanenin cihazına ya da hasta profiline özgü ayrıntıları öğrenip başka bir hastanede çöker. Aynı örüntü modern derin öğrenme ve computer vision sistemlerinde de görülür. Hatta büyük dil modelleri bile dar veriyle fine-tuning sırasında overfitting yaşayabilir: eğitim örneklerini ezberler, yeni istemlerde esnekliğini kaybeder. Bu nedenle bir modelin canlıya alınmadan önce gerçekten genelleyip genellemediğini ölçmek, ölçekli her MLOps sürecinin ayrılmaz parçasıdır. ## KVKK ve Güvenlik: Ezberlemenin Gizli Riski Overfitting'in az konuşulan ama kritik bir boyutu veri gizliliğidir. Aşırı öğrenen bir model, eğitim verisindeki bireysel örnekleri kelimesi kelimesine ezberleyebilir; bu, kişisel veri içeren eğitim setlerinde ciddi bir KVKK riski doğurur. Saldırganlar, "üyelik çıkarımı" (membership inference) gibi tekniklerle, belirli bir kişinin verisinin eğitimde kullanılıp kullanılmadığını anlayabilir; aşırı öğrenmiş modeller bu saldırılara çok daha açıktır. Bu yüzden overfitting yalnızca bir doğruluk sorunu değil, aynı zamanda bir mahremiyet ve uyum sorunudur. Regularizasyon, veri çeşitliliği ve dikkatli değerlendirme, modelin bireysel kayıtları ezberlemesini azaltarak hem genelleme başarısını hem de veri güvenliğini birlikte iyileştirir. Kişisel veri içeren sistemlerde overfitting'i düşürmek, aynı zamanda yasal riski de düşürür. ## Overfitting ile İlişkili Kavramlar Overfitting'i tek başına değil, çevresindeki kavramlarla birlikte anlamak gerekir. Bias-variance dengesi, overfitting (yüksek varyans) ile underfitting (yüksek yanlılık) arasındaki gerilimi tanımlar. Regularizasyon, varyansı düşürmenin başlıca yoludur. Cross validation, genelleme başarısını ölçmenin standardıdır. Genelleme ise tüm bu çabanın nihai hedefidir: modelin görmediği veride başarılı olması. Bu kavramlar birbirine kenetlidir. Regularizasyonu artırırsanız varyansı düşürür ama yanlılığı artırırsınız; azaltırsanız tersi olur. Cross validation size bu ayarı nereye getireceğinizi söyler. Dolayısıyla overfitting'i yönetmek, tek bir düğmeyi çevirmek değil, bu kavramları birlikte dengelemektir. Temel makine öğrenmesi ve yapay sinir ağı bilgisi, bu dengeyi kurmanın ön koşuludur. ## Overfitting'in Sınırları ve Yaygın Hatalar Overfitting kavramı güçlüdür ama etrafında sık yapılan hatalar vardır. Birincisi, her yüksek eğitim başarısını overfitting sanmaktır: eğer test başarısı da yüksek ve eğitime yakınsa, ortada sorun yoktur; bu iyi bir modeldir. İkincisi, tek bir test setine aşırı güvenmektir; test setini tekrar tekrar kullanarak model seçmek, dolaylı olarak o sete de overfit etmenize yol açar. Üçüncü yaygın hata, regularizasyonu abartmaktır: overfitting'ten kaçayım derken modeli fazla kısıtlarsanız underfitting'e düşersiniz. Dördüncüsü, veri sızıntısını göz ardı etmektir; test bilgisi eğitime karışırsa, model gerçekte overfit olsa bile metrikler yanıltıcı biçimde iyi görünür. Bu hatalardan kaçınmanın ortak yolu, disiplinli bir değerlendirme kurgusudur: temiz bir veri bölünmesi, cross validation ve genelleme başarısını dürüstçe raporlamak. ## Sıkça Sorulan Sorular ### Overfitting nasıl anlaşılır? En net işaret, eğitim başarısı ile doğrulama/test başarısı arasındaki farktır. Model eğitim setinde neredeyse kusursuz, ama daha önce görmediği veride belirgin biçimde kötüyse overfitting vardır. Bu farkı görmek için veriyi eğitim/doğrulama/test olarak ayırmak ve cross validation kullanmak gerekir. ### Overfitting ile underfitting arasındaki fark nedir? Overfitting'te model eğitim verisini ezberler; eğitimde çok iyi, testte kötüdür. Underfitting'te ise model örüntüyü hiç öğrenememiştir; hem eğitimde hem testte kötüdür. İlki fazla karmaşıklık, ikincisi yetersiz karmaşıklık sorunudur. İdeal nokta ikisinin arasındaki dengedir. ### Overfitting nasıl önlenir? Başlıca yöntemler: regularizasyon (L1/L2, dropout), daha fazla ve temiz veri, modeli sadeleştirmek, erken durdurma (early stopping) ve veri artırma (data augmentation). Bunların hepsi modelin gürültüyü değil gerçek örüntüyü öğrenmesini, yani genelleme yapmasını hedefler. ### Regularizasyon overfitting'i nasıl azaltır? Regularizasyon, modelin aşırı büyük ağırlıklar öğrenmesini cezalandırarak onu daha basit, daha düzgün çözümlere yönlendirir. Böylece model eğitim verisindeki tesadüfi ayrıntılara daha az takılır ve yeni veride daha iyi genelleme yapar. L2, L1 ve dropout en yaygın regularizasyon biçimleridir. ### Cross validation overfitting'i tespit eder mi? Evet. Cross validation, veriyi birden çok parçaya bölüp modeli her seferinde farklı bir parçada test ederek performansın tek bir şanslı bölünmeye bağlı olmadığını doğrular. Katmanlar arası başarı çok oynuyorsa veya ortalama test başarısı eğitimden çok düşükse, bu güçlü bir overfitting işaretidir. ### Büyük dil modelleri overfitting yaşar mı? Evet, büyük modeller de dar veya tekrarlı veriye fine-tuning sırasında overfitting yaşayabilir: eğitim örneklerini ezberler, yeni istemlerde esnekliğini kaybeder. Bu yüzden fine-tuning'de doğrulama seti, erken durdurma ve yeterli veri çeşitliliği kritik önemdedir. ## Özetle: Overfitting Nedir? Özetle overfitting nedir sorusunun cevabı şudur: bir modelin eğitim verisini ezberleyip yeni veride başarısız olması, yani genelleme yeteneğini kaybetmesi. Klasik işareti, eğitim ile test başarısı arasındaki büyük farktır; karşıt ucu underfitting'tir. Başlıca çareler regularizasyon, daha çok ve temiz veri, model sadeleştirme ve erken durdurmadır; ölçmenin standardı ise cross validation ve genelleme performansını izlemektir. Temel için makine öğrenmesi nedir ve derin öğrenme nedir rehberlerine göz atabilir, kurumsal bir yapay zeka projesini sağlam kurmak için yapay zeka danışmanlığı ile başlayabilirsiniz.