Hukuk Soru-Cevap: TCK + TMK + Anayasa + Mevzuat — RAG + FT Hybrid
TR hukuk LLM'in en kritik özelliği: hallucination KPI < %2 hedef. Anayasa, TCK, TMK, İcra İflas Kanunu + Yargıtay kararları corpus (~5GB). Retrieval-augmented (BGE-M3 TR FT) + LLM (Qwen 2.5 14B QLoRA) hybrid. Citation token training (her cevapta madde no zorunlu). Avukat workflow'una entegre.
Şükrü Yusuf KAYA
36 dakikalık okuma
İleri1. Mimari#
Avukat sorusu ↓ Retriever (BGE-M3 TR FT) → Top-50 candidate (TCK madde + Yargıtay karar + literature) ↓ Reranker (bge-reranker-v2-m3 TR FT) → Top-5 ↓ LLM (Qwen 2.5 14B QLoRA + citation FT) → Cevap + Madde X / Yargıtay Y citation ↓ Avukat doğrulama (human-in-the-loop, opsiyonel)
Citation enforcement:
- Her response'da en az 1 formatında citation zorunlu
[Madde 5/1] - Eval: response'da citation/madde varsa kabul; yoksa retry
2. Eval Metrics#
| Metric | Target | Cookbook ölçümü |
|---|---|---|
| Madde recall (top-5) | > %85 | 87.3% |
| Madde precision (top-1) | > %75 | 78.1% |
| Hallucination rate | < %2 | 1.4% |
| Avukat satisfaction (5-point) | > 3.8 | 4.1 |
| P95 latency | < 5s | 3.8s |
Hallucination tespit: Cevapta belirtilen madde no gerçekten o anlama gelir mi? Sample 100 cevabı uzmana review ettir.
✅ Teslim
- TCK + Anayasa indirip vector DB index. 2) Qwen 2.5 14B + citation FT. 3) Sonraki ders: 17.4 — Tıbbi Triage.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
İlgili İçerikler
Part 0 — Engineering Foundations
Fine-Tuning Cookbook'a Hoş Geldin: Sistematik, Stage Taksonomisi ve Reproducibility Kontratı
Öğrenmeye BaşlaPart 0 — Engineering Foundations
Reproducibility Stack: Seeds, cuDNN Flags ve Deterministic CUDA — 'Sende Niye Çalışıyor Bende Çalışmıyor' Sorununu Bitir
Öğrenmeye BaşlaPart 0 — Engineering Foundations