İçeriğe geç
RAG Workshopları

RAG Eğitimi: Kurumsal Bilgi Tabanı + LLM Workshopları

Retrieval-Augmented Generation (RAG) ile şirket içi dökümanlardan, veritabanlarından ve API'lardan beslenen üretim-hazır AI sistemleri kurulmasını öğretir.

ÖZET (TL;DR)

Tek cümlelik cevap: RAG workshopları — Retrieval-Augmented Generation mimarisini kurumsal dökümanlar üzerinden, vektör veritabanları + embedding modelleri + LLM ile production-hazır sistem kuracak şekilde öğretir.

  • Embedding modelleri (OpenAI, Cohere, Voyage, open-source) ve chunk stratejileri (semantic, fixed, hierarchical)
  • Vektör veritabanları: Pinecone, Weaviate, Qdrant, pgvector — seçim kriterleri ve performans testleri
  • Hybrid search (BM25 + vector), reranking, citation, evaluation (precision@k, MRR, NDCG)
  • Production: latency optimizasyonu, cost yönetimi, observability ve hallucination guardrails

RAG Workshopları — Programlar

Sıkça Sorulan Sorular

RAG nedir ve neden fine-tuning yerine RAG kullanılır?
RAG (Retrieval-Augmented Generation), LLM'e sorguyla ilgili kurumsal dökümanları otomatik bularak verir; model bu bilgiye dayanarak cevap üretir. Fine-tuning'e göre 3 avantajı vardır: (1) güncel veri kullanır (yeniden eğitime gerek yok), (2) kaynak gösterilebilir (hallucination düşer), (3) maliyet daha düşük. Çoğu kurumsal use-case için RAG daha uygundur.
Hangi vektör veritabanını seçmeliyim?
Workshop'ta karar matrisini öğretiyoruz. Genel rehber: küçük ölçek + Postgres altyapısı varsa **pgvector** (operasyon kolaylığı). Bulutta hızlı başlangıç için **Pinecone**. Self-hosted + filtreleme intensif ise **Qdrant** veya **Weaviate**. Yüksek hacim + maliyet hassas ise **Milvus**. Çoğu Türkiye projesinde Qdrant veya pgvector ile başlanır.
Chunking stratejisi neden bu kadar önemli?
RAG kalitesi büyük ölçüde retrieval kalitesine bağlıdır; retrieval kalitesi de chunk yapısına. Yanlış chunking (örn. cümle ortasından kesme, başlık bağlamını kaybetme) sonuçların %30-50 düşmesine neden olabilir. Workshop'ta fixed, semantic, hierarchical, parent-document gibi stratejileri kıyaslarız ve sizin doküman tipinize uygun olanı seçeriz.
Hybrid search nedir, neden gerekli?
Sadece vector search bazı sorgularda zayıftır (örn. spesifik ürün kodu, tarih, ID arama). Hybrid search, BM25 (keyword) + vector search + reranker kombinasyonu kullanır. Production RAG sistemlerinde hybrid search neredeyse her zaman saf vector search'ten daha iyi sonuç verir. Workshop'ta hybrid search'ü Qdrant/Weaviate üzerinde uygulamalı kuruyoruz.
RAG workshop sonunda neler yapabilir hale geleceğim?
Sonunda: (1) Şirket dökümanlarınızı parse edip vektör veritabanına atabilir, (2) embedding modeli + chunking stratejisi seçimi yapabilir, (3) hybrid retrieval + reranking pipeline kurabilir, (4) cevapları kaynak gösterimi ile döndürebilir, (5) production deployment + monitoring (latency, cost, quality drift) yapabilirsiniz.