topiccore

RAG Temelleri

Embedding + vector store + retrieve + augment — modelin bilmediği bilgiyi prompt'a enjekte et.

6 saat2 kaynak1 önkoşul

RAG = Retrieval-Augmented Generation.

Pipeline:

Belgeleri chunk'la (256-1024 token)
Her chunk'ı embed et (text-embedding-3, voyage-3, jina-v3)
Vector DB'ye yaz (Pinecone, Weaviate, pgvector, Qdrant)
Soru → embed → top-K benzer chunk
Chunk'ları prompt'a XML tag ile ekle
Modelin cevabı + kaynak referans

Prompt mühendisliği boyutu: Sadece retrieval iyiyse yetmez — prompt'a "yalnız <sources> dışına çıkma, bilmiyorsan 'bilmiyorum' de" tarzı sıkı guardrail koy.

Önce bunları bil

Context Window

Modelin tek seferde 'hatırlayabildiği' token sayısı. Bilmen şart.

→

Kaynaklar(2)

AMakale(1)

Pinecone — RAG Learning Path

· en

free

CKurs(1)

DeepLearning.AI — Building Apps with Vector DBs

· en

free

Önceki adım

Long-Context Teknikleri

Sıradaki

Bellek Pattern'leri

Tüm roadmap'i interaktif görüntüle