RAG Mimarisi 101: Niçin, Ne Zaman, Nasıl?

Retrieval-Augmented Generation: LLM'i kendi belgelerinle besleme. Mimari, faydalar, fine-tuning ile karşılaştırma.

Şükrü Yusuf KAYA

12 min read

6/26/2026

Intermediate

RAG: Retrieval-Augmented Generation#

LLM'in bilmediğin veriyi (şirket dökümanları, son haberler, özel domain) sorgulayabilmesi için kendi veritabanından çekip prompt'a yapıştıran mimari.

RAG'in Tipik Yapısı#

Hazırlık (offline):

Belgeleri chunk'lara böl
Her chunk'ı embed et
Vector DB'ye yaz

Sorgu zamanı (online):

Kullanıcı sorusunu embed et
Vector DB'de en yakın K chunk'ı bul
Bu chunkları + soruyu LLM'e gönder
LLM citation'lı cevap üretir

Niçin RAG?#

RAG Avantajları#

✅ Güncel veri (DB değişince anında güncel) ✅ Hallucination ↓ (kaynak grounding) ✅ Citation (kanıt sun) ✅ Veri gizliliği (model fine-tune'sız) ✅ Düşük maliyet (model eğitimi yok) ✅ Domain expertise ekle (kendi belge)

RAG Dezavantajları#

❌ Kalite retrieval'a bağlı (kötü retrieval = kötü cevap) ❌ Latans (extra round-trip) ❌ Karmaşıklık (DB, embed, scaling) ❌ Maliyet (embedding + storage) ❌ Bağlam pencere sınırı

Ne zaman fine-tune yerine RAG? Veri sık güncelleniyorsa, kaynak göstermek istiyorsan, küçük domain → RAG. Çok büyük + sabit + tone-spesifik → fine-tune.

Vector DB Seçenekleri (2026)#

Pinecone — production-grade, en olgun
Weaviate Cloud — açık kaynak alternatif
Qdrant Cloud — hızlı, Rust ile yazılmış
MongoDB Atlas Vector Search — mevcut Mongo varsa pratik
Postgres + pgvector — ucuz, mevcut DB ile entegre

Başlangıç önerisi: Postgres + pgvector. Mevcut DB'in zaten varsa ekstra altyapı yok. 1M doc'a kadar yeterli. Sonra ölçeklendir.

Yorumlar & Soru-Cevap

(0)

Yorum yazmak için giriş yap.

Yorumlar yükleniyor...

Pillar topics this article maps to

Pillar Topic

RAG (Retrieval-Augmented Generation) Architecture

RAG (Retrieval-Augmented Generation) is an architecture that grounds large-language-model answers in chunks retrieved from the organization's own documents or data sources, providing both freshness and citations.