İçeriğe geç
Kavram SözlüğüDoğal Dil İşleme

Tercih Optimizasyonu

Model çıktısını insan ya da sistem tercih sinyallerine göre daha kullanışlı hale getirmeyi amaçlayan hizalama yaklaşımı.

Tercih optimizasyonu, yalnızca doğru cevabı değil, daha yararlı, daha güvenli ve daha uygun biçimde sunulan cevabı hedefler. İnsan tercihi çiftleri, ödül modelleri veya doğrudan tercih optimizasyon yöntemleri bu amaçla kullanılabilir. Modern LLM hizalama sürecinin merkezindeki kavramlardan biridir. Özellikle kullanıcı deneyimi ve güvenli davranış üretimi açısından kritik önem taşır.