İçeriğe geç
Tüm roadmap'e dön
topiccore

RAG Temelleri

Embedding + vector store + retrieve + augment — modelin bilmediği bilgiyi prompt'a enjekte et.

6 saat2 kaynak1 önkoşul

RAG = Retrieval-Augmented Generation.

Pipeline:

  1. Belgeleri chunk'la (256-1024 token)
  2. Her chunk'ı embed et (text-embedding-3, voyage-3, jina-v3)
  3. Vector DB'ye yaz (Pinecone, Weaviate, pgvector, Qdrant)
  4. Soru → embed → top-K benzer chunk
  5. Chunk'ları prompt'a XML tag ile ekle
  6. Modelin cevabı + kaynak referans

Prompt mühendisliği boyutu: Sadece retrieval iyiyse yetmez — prompt'a "yalnız <sources> dışına çıkma, bilmiyorsan 'bilmiyorum' de" tarzı sıkı guardrail koy.

Önce bunları bil

Kaynaklar(2)