Command-R / Command-R+ + Granite 3: RAG-Native + Citation FT + Enterprise Tier
Cohere Command-R (35B) / Command-R+ (104B) — RAG-tuned baseline, citation token training native. IBM Granite 3 (2B/8B + 32B/MoE) — Apache 2.0 enterprise tier, governance odaklı. RAG-FT dataset format, citation accuracy ölçümü, tool-calling, 4×H100 80GB Command-R+ QLoRA reçetesi.
Şükrü Yusuf KAYA
28 dakikalık okuma
İleri1. Command-R Ailesi — Cohere#
| Model | Params | Context | Lisans | RAG-Native |
|---|---|---|---|---|
| Command-R | 35B | 128K | CC-BY-NC (research) | ✅ |
| Command-R+ | 104B | 128K | CC-BY-NC | ✅ |
| Command-R7B | 7B | 128K | CC-BY-NC | ✅ |
RAG-Native ne demek? Pre-train + SFT'de citation token format öğretilmiş:
<results> Document [1]: İstanbul nüfusu 15 milyondur. Document [2]: Bursa nüfusu 3 milyondur. </results> Soru: İki büyük şehrin nüfusu? Cevap: İstanbul 15 milyon [1], Bursa 3 milyon [2].
Lisans dikkati: CC-BY-NC = research only. Commercial deploy için OCİ Endpoints veya Bedrock üzerinden.
2. IBM Granite 3 — Enterprise Tier#
| Model | Params | Lisans | Notlar |
|---|---|---|---|
| Granite 3.1 2B | 2B | Apache 2.0 | edge / cost-effective |
| Granite 3.1 8B | 8B | Apache 2.0 | general |
| Granite 3.1 MoE 1B (3B active) | 3B active | Apache 2.0 | efficient |
| Granite 3.1 MoE 3B (8B active) | 8B active | Apache 2.0 | balanced |
IBM'in pozisyonu: Enterprise governance, Apache 2.0 (kısıtsız), audit trail için curated data.
Cookbook tavsiyesi: Enterprise compliance ihtiyacın varsa (telecom, banking, healthcare) — Granite 3.1 8B + custom domain FT.
✅ Teslim
- Command-R7B (open weights) ile mini RAG-FT lab. 2) Citation accuracy ölç (citation/[1] grep). 3) Sonraki ders: 4.10 — Hybrid SSM (Falcon-Mamba, Zamba2).
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
İlgili İçerikler
Part 0 — Engineering Foundations
Fine-Tuning Cookbook'a Hoş Geldin: Sistematik, Stage Taksonomisi ve Reproducibility Kontratı
Öğrenmeye BaşlaPart 0 — Engineering Foundations
Reproducibility Stack: Seeds, cuDNN Flags ve Deterministic CUDA — 'Sende Niye Çalışıyor Bende Çalışmıyor' Sorununu Bitir
Öğrenmeye BaşlaPart 0 — Engineering Foundations