Skip to content

RAG Mimarisi 101: Niçin, Ne Zaman, Nasıl?

Retrieval-Augmented Generation: LLM'i kendi belgelerinle besleme. Mimari, faydalar, fine-tuning ile karşılaştırma.

Şükrü Yusuf KAYA
12 min read
Intermediate

RAG: Retrieval-Augmented Generation

LLM'in bilmediğin veriyi (şirket dökümanları, son haberler, özel domain) sorgulayabilmesi için kendi veritabanından çekip prompt'a yapıştıran mimari.

RAG'in Tipik Yapısı#

Hazırlık (offline):
  1. Belgeleri chunk'lara böl
  2. Her chunk'ı embed et
  3. Vector DB'ye yaz
Sorgu zamanı (online):
  1. Kullanıcı sorusunu embed et
  2. Vector DB'de en yakın K chunk'ı bul
  3. Bu chunkları + soruyu LLM'e gönder
  4. LLM citation'lı cevap üretir

Niçin RAG?#

RAG Avantajları#

Güncel veri (DB değişince anında güncel) ✅ Hallucination ↓ (kaynak grounding) ✅ Citation (kanıt sun) ✅ Veri gizliliği (model fine-tune'sız) ✅ Düşük maliyet (model eğitimi yok) ✅ Domain expertise ekle (kendi belge)

RAG Dezavantajları#

Kalite retrieval'a bağlı (kötü retrieval = kötü cevap) ❌ Latans (extra round-trip) ❌ Karmaşıklık (DB, embed, scaling) ❌ Maliyet (embedding + storage) ❌ Bağlam pencere sınırı
Ne zaman fine-tune yerine RAG? Veri sık güncelleniyorsa, kaynak göstermek istiyorsan, küçük domain → RAG. Çok büyük + sabit + tone-spesifik → fine-tune.

Vector DB Seçenekleri (2026)#

  • Pinecone — production-grade, en olgun
  • Weaviate Cloud — açık kaynak alternatif
  • Qdrant Cloud — hızlı, Rust ile yazılmış
  • MongoDB Atlas Vector Search — mevcut Mongo varsa pratik
  • Postgres + pgvector — ucuz, mevcut DB ile entegre
Başlangıç önerisi: Postgres + pgvector. Mevcut DB'in zaten varsa ekstra altyapı yok. 1M doc'a kadar yeterli. Sonra ölçeklendir.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

Related Content

Connected pillar topics

Pillar topics this article maps to