Keşif-Sömürü Dengesi

EN: Exploration-Exploitation Trade-off

Tek Cümlede

Yeni bilgi toplamak için yeni seçenekleri denemek ile bilinen iyi seçenekleri kullanmak arasındaki denge problemi.

Keşif-sömürü dengesi, özellikle pekiştirmeli öğrenme ve karar verme sistemlerinde çok temel bir gerilimdir. Sistem bir yandan yeni seçenekleri deneyerek daha iyi stratejiler bulmak ister; diğer yandan hâlihazırda işe yaradığı bilinen seçimleri kullanarak kısa vadeli faydayı korumak ister. Çok fazla keşif verimsizlik yaratabilir, çok fazla sömürü ise daha iyi fırsatların hiç görülmemesine yol açabilir. Bu denge, iyi ajan tasarımının merkezindedir. Çünkü öğrenen sistemler yalnızca bildiklerine yaslanarak değil, bilinmeyeni kontrollü biçimde deneyerek gelişir.

İlginizi Çekebilir

Yapay zeka yolculuğunuza devam etmek için bu kavramlara da göz atabilirsiniz.

Akıl Yürütme

Elde bulunan bilgi, kural veya gözlemlerden yeni sonuçlar çıkarma ve kararları gerekçelendirme süreci.

Akıllı Ajan

Çevresini algılayıp hedeflerine ulaşmak için uygun eylemleri seçen otonom veya yarı otonom sistem yapısı.

Aktif Öğrenme

Modelin en bilgilendirici örnekleri seçerek insan veya uzman kaynaktan etiket istediği veri verimliliği yaklaşımı.

İncele

Tümünü Gör