Tüm roadmap'e dön
topiccore
RAG Temelleri
Embedding + vector store + retrieve + augment — modelin bilmediği bilgiyi prompt'a enjekte et.
6 saat2 kaynak1 önkoşul
RAG = Retrieval-Augmented Generation.
Pipeline:
- Belgeleri chunk'la (256-1024 token)
- Her chunk'ı embed et (text-embedding-3, voyage-3, jina-v3)
- Vector DB'ye yaz (Pinecone, Weaviate, pgvector, Qdrant)
- Soru → embed → top-K benzer chunk
- Chunk'ları prompt'a XML tag ile ekle
- Modelin cevabı + kaynak referans
Prompt mühendisliği boyutu: Sadece retrieval iyiyse yetmez — prompt'a "yalnız <sources> dışına çıkma, bilmiyorsan 'bilmiyorum' de" tarzı sıkı guardrail koy.