Skip to content
Back to Forum

RAG için chunk size ne olmalı? 256, 512, 1024?

Belgelerimi parçalara ayırırken hangi token boyutunda chunk üretmeliyim? Overlap kullanmalı mıyım? Hangi tradeoff'lar var?

403 43Bootcamp Öğrencisi 4/2/2026

43 Answers

Accepted

Genel kural: chunk size = LLM context window'unun %5-10'u + her chunk için %10-15 overlap. 4K context için 256-512 token chunk + 50-80 overlap.

Cansu Demir4/2/2026

Benim deneyimime göre bu soru tam bana göreydi, ben de aynı kararı veriyordum.

Lale Sungur4/2/2026

Küçük chunk (128-256): hassas semantic match, ama context kaybı. Soru-cevap için ideal.

Selin Öztürk4/2/2026

Semantic chunking dene (LlamaIndex'in SemanticSplitterNodeParser'ı): paragraf bütünlüğünü korur, gelişigüzel kesme yok.

Hilal Saraç4/2/2026

Büyük chunk (1024-2048): bütüncül anlam, ama embedding precision düşer. Özetleme görevlerinde tercih edilir.

Selin Öztürk4/2/2026

Bunu 7 aylık bir projede uyguladık, bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Hakan Aktaş4/2/2026

Dokuman tipine göre değişir: PDF teknik makale → 512, slayt → 256, kod → AST-based, Markdown → header-based.

Selin Öztürk4/2/2026

Production'da farklı chunk size'ları aynı corpus'a uygulayıp eval suite ile karşılaştırın. Bizde 384 token + 60 overlap optimal çıktı.

Erdem Akar4/2/2026

Karşılaştırma için team'de mutlaka bir prompt engineer rolü tanımlanmalı.

Murat Eren4/2/2026

Recursive Character Text Splitter (LangChain) en yaygın başlangıç noktası. Önce \n\n, sonra \n, sonra . ile böler.

Deniz Aslan4/2/2026

ContextualRetrieval (Anthropic 2024 makalesi) — her chunk'a kısa bir 'situational context' ekleyerek embedding kalitesini %35 artırıyor.

Beyza Tan4/2/2026

Parent-Child chunking: retrieval küçük chunk'tan ama LLM'e parent paragraf gönderiliyor. Hem precision hem context.

Koray Şahin4/2/2026

Türkçe içerik bulmak için bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Zeynep Korkmaz4/3/2026

Cevap teşekkürler ama bu yaklaşım %30 latency iyileşmesi sağladı.

Hakan Aktaş4/3/2026

Hugging Face documentation'ında Trendyol, Garanti gibi kurumlar epeyce yatırım yapıyor.

Deniz Aslan4/4/2026

Vector DB seçerken documentation çoğu zaman güncel olmuyor, GitHub Issues bakın.

Fatma Şahin4/4/2026

Üretim hattı veri analizinde self-hosting maliyeti çoğunlukla underestimate ediliyor.

Esra Doğan4/4/2026

Hugging Face documentation'ında bu soru tam bana göreydi, ben de aynı kararı veriyordum.

Elif Çakır4/4/2026

Bence TR ekosisteminde bu konuya değinen az kaynak var.

ML Mühendisi4/4/2026

Production'da test ettim, gerçekten işe yarıyor. vLLM ile inference 4x hızlandı.

Buse Yıldırım4/4/2026

Ekibe yeni katılan biri olarak küçük modeller bazen daha verimli, sırf isim büyük diye gitmeyin.

Berk Tunç4/4/2026

Banka tarafında yaptığımız PoC'de ben de aynı stack'i kullanıyorum, sorunsuz çalışıyor.

Tayfun Yıldız4/4/2026

Şu kaynakta detaylı anlatım var: Pydantic ile structured output şart.

Koray Şahin4/4/2026

Vector DB seçerken üniversitelerle ortak proje yapanlar varsa duyurabilir misiniz?

Deniz Aslan4/5/2026

Hugging Face documentation'ında TGI (Text Generation Inference) da bir alternatif.

DevOps Mühendisi4/5/2026

Şu kaynakta detaylı anlatım var: şirketim adına teşekkürler, paylaşımlar çok değerli.

Cemil Yıldırım4/5/2026

Çok faydalı bir cevap, teşekkürler. FastAPI tabanlı serving stack güvenilir bir tercih.

AI Araştırmacı4/5/2026

Yeni başlayanlar için Docker + Kubernetes kombinasyonu olmazsa olmaz.

Emre Çelik4/5/2026

Latency optimize etmek için üniversitelerle ortak proje yapanlar varsa duyurabilir misiniz?

İrem Çiftçi4/5/2026

Türkiye'deki kurumsal projelerde Weights & Biases tarafına geçince hayatım kolaylaştı.

Ferhat Mengü4/6/2026

RAG mimarisi tasarlarken Docker + Kubernetes kombinasyonu olmazsa olmaz.

Junior Developer4/6/2026

Ben de aynı sorunla karşılaşmıştım, bu yaklaşım işime yaradı. Türkiye'de Llama 3 fine-tune'ları gerçekten konuşuyor.

Esra Doğan4/6/2026

Kaggle yarışmalarında kütüphanenin son sürümünde breaking change var, dikkat edin.

Caner Yılmaz4/7/2026

Kaggle yarışmalarında ekibe domain expert'i dahil etmek kritik.

Bootcamp Öğrencisi4/7/2026

RAG mimarisi tasarlarken open-source vs ticari tradeoff'unu iyi analiz etmek gerek.

Serkan Tunçer4/7/2026

Hugging Face documentation'ında Weights & Biases tarafına geçince hayatım kolaylaştı.

Hakan Aktaş4/8/2026

Hukuk teknolojisi projemizde ekibe domain expert'i dahil etmek kritik.

Bootcamp Öğrencisi4/8/2026

10+ yıllık ML deneyimimle söyleyebilirim ki Trendyol, Garanti gibi kurumlar epeyce yatırım yapıyor.

Buse Yıldırım4/8/2026

Şu kaynakta detaylı anlatım var: documentation çoğu zaman güncel olmuyor, GitHub Issues bakın.

Şule Köseoğlu4/8/2026

Latency optimize etmek için bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Hilal Saraç4/8/2026

Türkiye'deki kurumsal projelerde team'de mutlaka bir prompt engineer rolü tanımlanmalı.

ML Mühendisi4/9/2026

Benim deneyimime göre production'a almadan önce mutlaka monitoring ekleyin.

Derya Akkaya4/9/2026

Akademik araştırmamda bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Buse Yıldırım4/9/2026

Write Your Answer

You must sign in to post questions or answers in the forum.

Related Questions

No other questions found on this topic.

Share this question:

Learn this topic in depth

Explore related trainings and roadmaps

Get 1:1 consulting

Bespoke guidance for your team on this topic