Keşif-Sömürü Dengesi
Yeni bilgi toplamak için yeni seçenekleri denemek ile bilinen iyi seçenekleri kullanmak arasındaki denge problemi.
Keşif-sömürü dengesi, özellikle pekiştirmeli öğrenme ve karar verme sistemlerinde çok temel bir gerilimdir. Sistem bir yandan yeni seçenekleri deneyerek daha iyi stratejiler bulmak ister; diğer yandan hâlihazırda işe yaradığı bilinen seçimleri kullanarak kısa vadeli faydayı korumak ister. Çok fazla keşif verimsizlik yaratabilir, çok fazla sömürü ise daha iyi fırsatların hiç görülmemesine yol açabilir. Bu denge, iyi ajan tasarımının merkezindedir. Çünkü öğrenen sistemler yalnızca bildiklerine yaslanarak değil, bilinmeyeni kontrollü biçimde deneyerek gelişir.
İlginizi Çekebilir
Yapay zeka yolculuğunuza devam etmek için bu kavramlara da göz atabilirsiniz.
