Bias Eval TR: BBQ-TR — Cinsiyet / Etnik / Mezhep / Yaş / SES Probe + Mitigation
BBQ (Bias Benchmark for QA, Parrish 2022) TR adaptation: cinsiyet, etnik (Türk/Kürt/Arap/Ermeni), mezhep (Sünni/Alevi), yaş, sosyoekonomik durum, fiziksel görünüm 9 kategoride bias probe. 1200 ambiguous question pair. Cookbook'un mitigation reçetesi: balanced SFT data + DPO bias-rejection examples.
Şükrü Yusuf KAYA
28 dakikalık okuma
İleri✅ Teslim
- BBQ-TR (cookbook reference) ile model bias score ölç. 2) DPO bias-rejection pair üret. 3) Sonraki ders: 18.7 — Red-Teaming Lab.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
İlgili İçerikler
Part 0 — Engineering Foundations
Fine-Tuning Cookbook'a Hoş Geldin: Sistematik, Stage Taksonomisi ve Reproducibility Kontratı
Öğrenmeye BaşlaPart 0 — Engineering Foundations
Reproducibility Stack: Seeds, cuDNN Flags ve Deterministic CUDA — 'Sende Niye Çalışıyor Bende Çalışmıyor' Sorununu Bitir
Öğrenmeye BaşlaPart 0 — Engineering Foundations