Pekiştirmeli Öğrenme

EN: Reinforcement Learning

Tek Cümlede

Bir ajanın çevreyle etkileşim kurarak ödül ve ceza üzerinden uzun vadeli davranış politikası öğrenmesini sağlayan paradigma.

Pekiştirmeli öğrenme, bir ajanın çevreyle etkileşim kurarak hangi davranışların uzun vadede daha iyi sonuç verdiğini öğrenmesine dayanan güçlü bir paradigmadır. Burada sistem, tek seferlik doğru cevabı ezberlemez; aksine yaptığı seçimlerin sonuçlarını görür, ödül veya ceza alır ve zaman içinde stratejisini geliştirir. Bu yapı oyun oynayan ajanlarda, robotikte, dinamik kaynak yönetiminde ve ardışık karar verme gerektiren birçok senaryoda karşımıza çıkar. Pekiştirmeli öğrenmeyi ilginç yapan şey, yalnızca tahmin değil davranış öğrenimi üretmesidir. Zor tarafı ise, iyi ödül tasarımı yapılmadığında sistemin teknik olarak “başarılı” ama pratikte istenmeyen davranışlar geliştirebilmesidir.

İlginizi Çekebilir

Yapay zeka yolculuğunuza devam etmek için bu kavramlara da göz atabilirsiniz.

Akıl Yürütme

Elde bulunan bilgi, kural veya gözlemlerden yeni sonuçlar çıkarma ve kararları gerekçelendirme süreci.

Akıllı Ajan

Çevresini algılayıp hedeflerine ulaşmak için uygun eylemleri seçen otonom veya yarı otonom sistem yapısı.

Aktif Öğrenme

Modelin en bilgilendirici örnekleri seçerek insan veya uzman kaynaktan etiket istediği veri verimliliği yaklaşımı.

İncele

Tümünü Gör