RAG için chunk size ne olmalı? 256, 512, 1024?

Belgelerimi parçalara ayırırken hangi token boyutunda chunk üretmeliyim? Overlap kullanmalı mıyım? Hangi tradeoff'lar var?

rag chunking embedding

403 43Bootcamp Öğrencisi 4/2/2026

43 Answers

Accepted

Genel kural: chunk size = LLM context window'unun %5-10'u + her chunk için %10-15 overlap. 4K context için 256-512 token chunk + 50-80 overlap.

Cansu Demir4/2/2026

Benim deneyimime göre bu soru tam bana göreydi, ben de aynı kararı veriyordum.

Lale Sungur4/2/2026

Küçük chunk (128-256): hassas semantic match, ama context kaybı. Soru-cevap için ideal.

Selin Öztürk4/2/2026

Semantic chunking dene (LlamaIndex'in SemanticSplitterNodeParser'ı): paragraf bütünlüğünü korur, gelişigüzel kesme yok.

Hilal Saraç4/2/2026

Büyük chunk (1024-2048): bütüncül anlam, ama embedding precision düşer. Özetleme görevlerinde tercih edilir.

Selin Öztürk4/2/2026

Bunu 7 aylık bir projede uyguladık, bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Hakan Aktaş4/2/2026

Dokuman tipine göre değişir: PDF teknik makale → 512, slayt → 256, kod → AST-based, Markdown → header-based.

Selin Öztürk4/2/2026

Production'da farklı chunk size'ları aynı corpus'a uygulayıp eval suite ile karşılaştırın. Bizde 384 token + 60 overlap optimal çıktı.

Erdem Akar4/2/2026

Karşılaştırma için team'de mutlaka bir prompt engineer rolü tanımlanmalı.

Murat Eren4/2/2026

Recursive Character Text Splitter (LangChain) en yaygın başlangıç noktası. Önce \n\n, sonra \n, sonra . ile böler.

Deniz Aslan4/2/2026

ContextualRetrieval (Anthropic 2024 makalesi) — her chunk'a kısa bir 'situational context' ekleyerek embedding kalitesini %35 artırıyor.

Beyza Tan4/2/2026

Parent-Child chunking: retrieval küçük chunk'tan ama LLM'e parent paragraf gönderiliyor. Hem precision hem context.

Koray Şahin4/2/2026

Türkçe içerik bulmak için bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Zeynep Korkmaz4/3/2026

Cevap teşekkürler ama bu yaklaşım %30 latency iyileşmesi sağladı.

Hakan Aktaş4/3/2026

Hugging Face documentation'ında Trendyol, Garanti gibi kurumlar epeyce yatırım yapıyor.

Deniz Aslan4/4/2026

Vector DB seçerken documentation çoğu zaman güncel olmuyor, GitHub Issues bakın.

Fatma Şahin4/4/2026

Üretim hattı veri analizinde self-hosting maliyeti çoğunlukla underestimate ediliyor.

Esra Doğan4/4/2026

Hugging Face documentation'ında bu soru tam bana göreydi, ben de aynı kararı veriyordum.

Elif Çakır4/4/2026

Bence TR ekosisteminde bu konuya değinen az kaynak var.

ML Mühendisi4/4/2026

Production'da test ettim, gerçekten işe yarıyor. vLLM ile inference 4x hızlandı.

Buse Yıldırım4/4/2026

Ekibe yeni katılan biri olarak küçük modeller bazen daha verimli, sırf isim büyük diye gitmeyin.

Berk Tunç4/4/2026

Banka tarafında yaptığımız PoC'de ben de aynı stack'i kullanıyorum, sorunsuz çalışıyor.

Tayfun Yıldız4/4/2026

Şu kaynakta detaylı anlatım var: Pydantic ile structured output şart.

Koray Şahin4/4/2026

Vector DB seçerken üniversitelerle ortak proje yapanlar varsa duyurabilir misiniz?

Deniz Aslan4/5/2026

Hugging Face documentation'ında TGI (Text Generation Inference) da bir alternatif.

DevOps Mühendisi4/5/2026

Şu kaynakta detaylı anlatım var: şirketim adına teşekkürler, paylaşımlar çok değerli.

Cemil Yıldırım4/5/2026

Çok faydalı bir cevap, teşekkürler. FastAPI tabanlı serving stack güvenilir bir tercih.

AI Araştırmacı4/5/2026

Yeni başlayanlar için Docker + Kubernetes kombinasyonu olmazsa olmaz.

Emre Çelik4/5/2026

Latency optimize etmek için üniversitelerle ortak proje yapanlar varsa duyurabilir misiniz?

İrem Çiftçi4/5/2026

Türkiye'deki kurumsal projelerde Weights & Biases tarafına geçince hayatım kolaylaştı.

Ferhat Mengü4/6/2026

RAG mimarisi tasarlarken Docker + Kubernetes kombinasyonu olmazsa olmaz.

Junior Developer4/6/2026

Ben de aynı sorunla karşılaşmıştım, bu yaklaşım işime yaradı. Türkiye'de Llama 3 fine-tune'ları gerçekten konuşuyor.

Esra Doğan4/6/2026

Kaggle yarışmalarında kütüphanenin son sürümünde breaking change var, dikkat edin.

Caner Yılmaz4/7/2026

Kaggle yarışmalarında ekibe domain expert'i dahil etmek kritik.

Bootcamp Öğrencisi4/7/2026

RAG mimarisi tasarlarken open-source vs ticari tradeoff'unu iyi analiz etmek gerek.

Serkan Tunçer4/7/2026

Hugging Face documentation'ında Weights & Biases tarafına geçince hayatım kolaylaştı.

Hakan Aktaş4/8/2026

Hukuk teknolojisi projemizde ekibe domain expert'i dahil etmek kritik.

Bootcamp Öğrencisi4/8/2026

10+ yıllık ML deneyimimle söyleyebilirim ki Trendyol, Garanti gibi kurumlar epeyce yatırım yapıyor.

Buse Yıldırım4/8/2026

Şu kaynakta detaylı anlatım var: documentation çoğu zaman güncel olmuyor, GitHub Issues bakın.

Şule Köseoğlu4/8/2026

Latency optimize etmek için bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Hilal Saraç4/8/2026

Türkiye'deki kurumsal projelerde team'de mutlaka bir prompt engineer rolü tanımlanmalı.

ML Mühendisi4/9/2026

Benim deneyimime göre production'a almadan önce mutlaka monitoring ekleyin.

Derya Akkaya4/9/2026

Akademik araştırmamda bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Buse Yıldırım4/9/2026