TR Reranker FT: bge-reranker + jina-reranker — Pair Generation Recipe
RAG pipeline'ın 2. aşaması: reranker. bge-reranker-v2-m3 (TR'de baseline) + jina-reranker-v2 + custom TR FT. Query-doc relevance score, cross-encoder mimari, hard-negative mining, RTX 4090 + 50K TR pairs 4 saatte FT.
Şükrü Yusuf KAYA
24 dakikalık okuma
İleripython
# === bge-reranker-v2-m3 TR FT ===from sentence_transformers import CrossEncoder, InputExamplefrom torch.utils.data import DataLoader model = CrossEncoder("BAAI/bge-reranker-v2-m3", device="cuda", max_length=512) # Dataset — (query, doc, label) çiftleri (label: 0 = irrelevant, 1 = relevant)train_examples = []for query, pos_doc, neg_docs in tr_dataset: train_examples.append(InputExample(texts=[query, pos_doc], label=1.0)) for neg in neg_docs[:5]: train_examples.append(InputExample(texts=[query, neg], label=0.0)) train_dataloader = DataLoader(train_examples, batch_size=16, shuffle=True) model.fit( train_dataloader=train_dataloader, epochs=2, warmup_steps=500, optimizer_params={"lr": 1e-5}, output_path="bge-reranker-tr",) # RAG pipeline'da kullanım:# 1. Embedding ile top-50 candidate al# 2. Reranker ile top-50'yi rerank → top-5# 3. LLM'e top-5'i vercandidates = retriever.retrieve(query, top_k=50)scores = reranker.predict([(query, c) for c in candidates])top5 = [c for c, s in sorted(zip(candidates, scores), key=lambda x: -x[1])[:5]]TR reranker FT + RAG pipeline kullanımı
✅ Teslim
- bge-reranker TR FT yap. 2) RAG pipeline'da kullan. 3) Eval: NDCG@5, MRR@10. 4) Sonraki ders: 9.9 — Agglutination & TR Pitfalls.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
İlgili İçerikler
Part 0 — Engineering Foundations
Fine-Tuning Cookbook'a Hoş Geldin: Sistematik, Stage Taksonomisi ve Reproducibility Kontratı
Öğrenmeye BaşlaPart 0 — Engineering Foundations
Reproducibility Stack: Seeds, cuDNN Flags ve Deterministic CUDA — 'Sende Niye Çalışıyor Bende Çalışmıyor' Sorununu Bitir
Öğrenmeye BaşlaPart 0 — Engineering Foundations
Environment Pinning: uv + pyproject.toml, CUDA Version Matrix ve Container Reçeteleri
Öğrenmeye BaşlaBağlantılı Pillar Konular