Terimler Kütüphanesi

Kavram SözlüğüÜretken Yapay Zekâ ve LLM

Doğrudan Tercih Optimizasyonu

Tercih çiftlerinden doğrudan öğrenerek hizalama yapmayı hedefleyen daha sade alignment yaklaşımı.

DPO, klasik ödül modeli ve pekiştirmeli öğrenme zincirine göre daha doğrudan bir hizalama yöntemi sunar. İnsan veya sistem tercihleri çiftli karşılaştırmalar üzerinden modele aktarılır. Bu yapı, uygulamada daha kararlı ve daha kolay optimize edilebilir hizalama süreçleri sağlayabilir.

İlginizi Çekebilir

Yapay zeka yolculuğunuza devam etmek için bu kavramlara da göz atabilirsiniz.

Glossary Cover

yapay-zeka-temelleri

Üretken Yapay Zekâ

Metin, görsel, ses, video veya kod gibi yeni içerikler üretebilen yapay zekâ sistemleri sınıfı.

Glossary Cover

Decoder-Only Transformer

Otokorelasyonlu biçimde bir sonraki tokenı tahmin ederek üretim yapan modern büyük dil modeli mimarisi.

Glossary Cover

Additive Attention

Sorgu ve bağlam temsillerini öğrenilebilir bir birleşim fonksiyonu ile karşılaştıran erken dönem dikkat yaklaşımı.