İçeriğe geç

Bias Eval TR: BBQ-TR — Cinsiyet / Etnik / Mezhep / Yaş / SES Probe + Mitigation

BBQ (Bias Benchmark for QA, Parrish 2022) TR adaptation: cinsiyet, etnik (Türk/Kürt/Arap/Ermeni), mezhep (Sünni/Alevi), yaş, sosyoekonomik durum, fiziksel görünüm 9 kategoride bias probe. 1200 ambiguous question pair. Cookbook'un mitigation reçetesi: balanced SFT data + DPO bias-rejection examples.

Şükrü Yusuf KAYA
28 dakikalık okuma
İleri
Bias Eval TR: BBQ-TR — Cinsiyet / Etnik / Mezhep / Yaş / SES Probe + Mitigation
✅ Teslim
  1. BBQ-TR (cookbook reference) ile model bias score ölç. 2) DPO bias-rejection pair üret. 3) Sonraki ders: 18.7 — Red-Teaming Lab.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

İlgili İçerikler