# LlamaIndex ve Vector DB ile RAG Eğitimi (Pinecone, Chroma, Weaviate, Qdrant)

> Source: https://sukruyusufkaya.com/training/llamaindex-vector-db-rag-egitimi
> Updated: 2026-06-24T21:55:03.016Z
> Level: advanced
> Topics: llamaindex, vector database, pinecone, chroma, weaviate, qdrant, pgvector, llamaparse, rag patterns, knowledge graph rag, property graph index, advanced retrieval, reranking, auto-retrieval, multi-modal rag, ragas evaluation, trulens, llamaindex workflows, agentic rag, enterprise knowledge base
**TLDR:** Enterprise knowledge base ve production-grade RAG sistemleri inşa etmek isteyen AI engineer'lar için LlamaIndex'in data-first paradigmasını, 5 ana vector DB'yi karşılaştırmalı ele alan ve Knowledge Graph + Property Graph index ile multi-modal RAG'a kadar uzanan 3 günlük ileri seviye program. LlamaParse, advanced retrieval, RAGAS/TruLens eval dahil.

## Açıklama

LlamaIndex ve Vector DB ile RAG Eğitimi, LlamaIndex'in data-first paradigmasını ve modern vector DB ekosistemini (Pinecone, Chroma, Weaviate, Qdrant, pgvector) bütünleşik mühendislik bakışıyla ele alan 3 günlük ileri seviye bir programdır. Eğitim; LlamaParse ile production-grade doküman parsing, LlamaHub connector ekosistemi, index taksonomi (VectorStore, Summary, Tree, KG, Property Graph), advanced retrieval pattern'ları (hybrid, recursive, auto, reranking), Knowledge Graph + Property Graph Index, LlamaIndex Workflows ile agentic RAG, multi-modal RAG (image, table, video), RAGAS / TruLens / native eval framework, multi-tenant production deployment ve KVKK uyumlu enterprise knowledge base mimarisi konularını birlikte kapsar.

## Kazanımlar

- LlamaIndex ekosistemini (Core, Cloud, Parse, Hub, Workflows) bütünleşik şekilde yönetebilirsiniz.
- Pinecone, Chroma, Weaviate, Qdrant, pgvector arasında mimari karar verebilirsiniz.
- LlamaParse ile production-grade complex PDF, DOCX ve XLSX parsing yapabilirsiniz.
- VectorStoreIndex, SummaryIndex, TreeIndex, KG Index gibi index tiplerini doğru senaryoda kullanabilirsiniz.
- Hybrid retrieval, reranking, recursive ve auto-retrieval ile precision/recall optimize edebilirsiniz.
- Knowledge Graph + Property Graph Index ile structured RAG sistemleri kurabilirsiniz.
- LlamaIndex Workflows ile event-driven agentic RAG mimarisi tasarlayabilirsiniz.
- Multi-modal RAG ile image, table, video, PDF üzerinde sorgu yapabilirsiniz.
- RAGAS, TruLens ve native eval ile production-grade RAG evaluation kurabilirsiniz.

<p>Bu eğitim, LlamaIndex'i data-first paradigmasıyla kullanarak production-grade enterprise knowledge base ve RAG sistemleri inşa etmek isteyen AI engineer'lar, data engineer'lar, ML engineer'lar, knowledge management architect'leri ve platform geliştiriciler için tasarlanmıştır. Programın merkezinde şu yaklaşım yer alır: LlamaIndex'i öğrenmek, basitçe 'PDF'i vector DB'ye atıp top-k retrieval yapmak' değildir. Gerçek mühendislik değeri; LlamaParse ile production-grade doküman parsing, doğru chunk size ve metadata enrichment, vector DB seçiminde sharding/replication/scaling kararları, advanced retrieval pattern'larıyla (hybrid, recursive, auto-retrieval, reranking) precision/recall optimization, Knowledge Graph + Property Graph Index ile structured retrieval, agentic RAG için event-driven Workflows mimarisi, multi-modal RAG için image-text alignment, ve KVKK uyumlu multi-tenant production deployment kurmakla oluşur.</p>

<p>LlamaIndex ekosistemi son üç yılda hızla olgunlaştı ve 2026 itibarıyla beş ana ürün etrafında yapılandı: LlamaIndex Core (index taksonomi, retriever, query engine, response synthesizer), LlamaCloud (managed parsing + indexing), LlamaParse (production-grade document parsing), LlamaHub (100+ connector), LlamaIndex Workflows (event-driven multi-step pipeline) ve LlamaIndex Agents (FunctionAgent, ReActAgent, AgentWorkflow). Bu eğitim, söz konusu beş ürünü ayrı silolar olarak değil, bütünleşik bir data engineering + RAG framework'ü olarak ele alır. Türkiye'de LlamaIndex'e özel kapsamlı eğitim neredeyse yoktur; LangChain kursları mevcut ancak LlamaIndex'in data-first paradigması, LlamaParse production parsing, Knowledge Graph Index ve LlamaIndex Workflows gibi ayırt edici özellikler genelde işlenmemektedir. Bu program söz konusu boşluğu Türkiye'nin en kapsamlı LlamaIndex + Vector DB referans eğitimi olarak doldurmak üzere tasarlanmıştır.</p>

<p>Programın stratejik bir boyutu, LlamaIndex'in agentic AI ekosistemindeki yerini diğer framework ve yaklaşımlarla karşılaştırarak konumlandırmasıdır. LangChain ile karşılaştırma özellikle önemlidir: LangChain general-purpose application-first framework iken, LlamaIndex data-first odaklı, çok büyük corpora (1M+ doküman) için optimize edilmiş bir araçtır. Index taksonomi (VectorStoreIndex, SummaryIndex, TreeIndex, KnowledgeGraphIndex, DocumentSummaryIndex, CompositeIndex) LangChain'de yok; bu, LlamaIndex'in benzersiz mimari farklılığıdır. Haystack ve raw LLM SDK'larıyla karşılaştırma da yapılır; her yaklaşımın güçlü ve zayıf yönleri, hangi proje türü için doğru tercih olduğu detaylı analiz edilir.</p>

<p>Programın belkemiği vector DB karşılaştırma modülüdür. 2026'nın önde gelen 5 vector DB'si — Pinecone (serverless managed), Chroma (embedded + client-server), Weaviate (open-source + hybrid + multi-modal native), Qdrant (open-source + performance focused), pgvector (Postgres native) — birebir karşılaştırılır. HNSW, IVF ve ScaNN gibi indexing algoritmaları; sharding, replication, scaling karakteristikleri; managed vs self-hosted maliyet trade-off'ları; Türkiye için KVKK uyumlu self-hosted vs cloud kararı; namespace ve metadata filtering yapıları detaylı işlenir. Ayrıca Milvus, LanceDB ve MongoDB Atlas Vector Search gibi alternatifler de karar matrisine dahil edilir. Bu, Türkiye'de bu derinlikte vector DB karşılaştırması yapan tek eğitimdir.</p>

<p>LlamaParse modülü, LlamaIndex ekosisteminin en güçlü ayırt edicilerinden biridir. PyPDF, Unstructured.io ve AWS Textract gibi alternatiflerle birebir karşılaştırılır; karmaşık table extraction, image OCR, formula parsing ve markdown output gibi konularda LlamaParse'ın üstünlükleri uygulamalı egzersizlerle gösterilir. Production senaryolarında — sigorta poliçeleri, finansal raporlar, akademik makaleler, mühendislik dokümanları — LlamaParse'ın doğru parametre seçimi ve cost-effective kullanımı detaylı işlenir. Türkçe doküman parsing'in nüansları, morfoloji bilincinde chunking stratejileri ve token counting de bu modülün parçasıdır.</p>

<p>Index taksonomi modülü, LlamaIndex'in benzersiz mimari farkını ortaya koyar. VectorStoreIndex (klasik semantic search), SummaryIndex (full-document iteration), TreeIndex (hierarchical recursive summarization), KeywordTableIndex (keyword-based filtering), DocumentSummaryIndex (hybrid retrieval) ve CompositeIndex (multi-index orchestration) detaylı işlenir. Router Query Engine ile dinamik index seçimi, multi-document Doc Agent pattern'ı, Storage Context (DocStore, IndexStore, VectorStore) katmanları ve persistent index + incremental update stratejileri kapsamlı şekilde ele alınır. Birden fazla index'i orkestre etmenin disiplini, klasik tek-vector-DB yaklaşımının ötesinde bir mimari olgunluk sağlar.</p>

<p>Retriever ve query engine modülünde top-k retrieval, hybrid (sparse + dense), QueryFusionRetriever ile reciprocal rank fusion, Auto Merging Retriever, SubQuestion QueryEngine ile query decomposition ve Router Query Engine işlenir. Response Synthesizer'ın refine, compact, tree_summarize, accumulate modları; streaming response; token-by-token output gibi production konuları uygulamalı şekilde gösterilir. Ardından gelen advanced retrieval modülünde cross-encoder reranker (bge-reranker-v2, Cohere Rerank, Voyage Rerank), LLM-as-reranker, recursive retrieval (chunk → parent document), auto-retrieval (LLM-generated metadata filters), sentence-window ve parent-document pattern'ları ele alınır. Bu disiplin, basic RAG'ın retrieval kalitesini %30-50 oranında iyileştirir.</p>

<p>Programın belki en ayırt edici modülü Knowledge Graph + Property Graph Index'e ayrılmıştır. LlamaIndex, dokümanlardan otomatik entity-relation extraction yapan ve schema-aware bilgi tabanları kuran tek mainstream RAG framework'üdür. Bu eğitim; automatic entity ve relation extraction, schema-free vs schema-aware KG kurulumu, KGTableRetriever ile hybrid KG + vector retrieval, Property Graph Index ile zengin schema-aware bilgi tabanı, GraphRAG yaklaşımı ve Microsoft GraphRAG ile karşılaştırma, Neo4j / FalkorDB / Nebula gibi graph backend entegrasyonları konularını detaylı işler. Bu disiplin, özellikle finans, sağlık ve hukuk gibi structured-data-rich sektörlerde RAG kalitesini dramatik artırır.</p>

<p>LlamaIndex Workflows modülü, framework'ün agentic RAG paradigmasını öğretir. @step decorator ile event-driven pipeline tasarımı, context / branch / join / loop pattern'ları, streaming workflow, mid-flight observability işlenir. Agent tiplerinde FunctionAgent (structured tool use), ReActAgent (thought-action-observation döngüsü) ve AgentWorkflow (multi-agent orchestration) detaylı ele alınır. Agentic RAG pattern'ları olarak query router agent, dynamic index selection, self-correcting RAG ve replan-on-failure mekanikleri gösterilir.</p>

<p>Multi-modal RAG modülü, LlamaIndex'in 2026 itibarıyla olgun multi-modal yeteneklerini ele alır. MultiModalVectorStoreIndex ile image-text alignment, CLIP / ImageBind / Voyage multi-modal embedding modelleri, GPT-5 Vision / Claude Opus 4.7 Vision / Gemini 2.5 Pro Vision karşılaştırması, LlamaParse table extraction ile recursive node parsing, nested table'lar, table-as-image fallback yaklaşımı, Whisper transcript + LlamaIndex pipeline, scene detection ve timestamp-aware retrieval konuları uygulamalı işlenir. Multi-modal RAG, sigorta hasar dosyaları, e-ticaret ürün katalogları, mühendislik çizimleri ve medikal görüntüler gibi gerçek production senaryolarına doğrudan uygulanabilir.</p>

<p>Evaluation modülü, eğitimin production discipline boyutunu temsil eder. RAGAS framework metrikleri (faithfulness, answer relevancy, context recall, context precision); RAGAS testset.synthesize ile sentetik test set; TruLens feedback functions ve trace anatomy; TruLens dashboard ve A/B karşılaştırma; LlamaIndex native CorrectnessEvaluator, FaithfulnessEvaluator, RelevancyEvaluator; BatchEvalRunner ile regression test pipeline detaylı işlenir. Production deployment modülünde FastAPI + LlamaIndex endpoint, LlamaCloud managed deployment, Vercel / AWS / GCP / Kubernetes karşılaştırması, namespace isolation ile tenant-aware indexing, vector DB metadata filtering ile tenant erişim kontrolü, KVKK uyumlu multi-tenant strateji, embedding caching, query cache, semantic cache ve model routing (GPT-5 + Sonnet + Haiku + Local hybrid) konuları uçtan uca ele alınır.</p>

<p>Capstone projesinde her katılımcı, kendi şirketi için uçtan uca production-grade bir enterprise knowledge base ve RAG sistemi tasarlar: LlamaParse → chunking → embedding → vector DB → retrieval → eval → deployment pipeline'ı; vector DB seçimi ve multi-tenant deployment topolojisi; Knowledge Graph + vector hibrit mimari; eval rapor ve cost projection. Eğitim sonunda katılımcılar; LlamaIndex ekosistemini data-first paradigması içinde bütünleşik şekilde yönetebilecek, 5 ana vector DB arasında mimari karar verebilecek, LlamaParse ile production-grade parsing yapabilecek, advanced retrieval pattern'larıyla precision/recall optimize edebilecek, Knowledge Graph + Property Graph Index ile structured RAG kurabilecek, LlamaIndex Workflows ile agentic RAG mimarisi tasarlayabilecek, multi-modal RAG yapabilecek, RAGAS/TruLens ile production eval kurabilecek ve KVKK uyumlu multi-tenant deployment yapabilecek seviyede teknik ve mimari yetkinliğe ulaşır. Eğitim 3 gün, 12 modül ve 80'in üzerinde uygulamalı ders içerir.</p>