RAG için chunk size ne olmalı? 256, 512, 1024?

Belgelerimi parçalara ayırırken hangi token boyutunda chunk üretmeliyim? Overlap kullanmalı mıyım? Hangi tradeoff'lar var?

rag chunking embedding

403 43Bootcamp Öğrencisi 02.04.2026

43 Cevap

Kabul Edildi

Genel kural: chunk size = LLM context window'unun %5-10'u + her chunk için %10-15 overlap. 4K context için 256-512 token chunk + 50-80 overlap.

Cansu Demir02.04.2026

Benim deneyimime göre bu soru tam bana göreydi, ben de aynı kararı veriyordum.

Lale Sungur02.04.2026

Küçük chunk (128-256): hassas semantic match, ama context kaybı. Soru-cevap için ideal.

Selin Öztürk02.04.2026

Semantic chunking dene (LlamaIndex'in SemanticSplitterNodeParser'ı): paragraf bütünlüğünü korur, gelişigüzel kesme yok.

Hilal Saraç02.04.2026

Büyük chunk (1024-2048): bütüncül anlam, ama embedding precision düşer. Özetleme görevlerinde tercih edilir.

Selin Öztürk02.04.2026

Bunu 7 aylık bir projede uyguladık, bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Hakan Aktaş02.04.2026

Dokuman tipine göre değişir: PDF teknik makale → 512, slayt → 256, kod → AST-based, Markdown → header-based.

Selin Öztürk02.04.2026

Production'da farklı chunk size'ları aynı corpus'a uygulayıp eval suite ile karşılaştırın. Bizde 384 token + 60 overlap optimal çıktı.

Erdem Akar02.04.2026

Karşılaştırma için team'de mutlaka bir prompt engineer rolü tanımlanmalı.

Murat Eren02.04.2026

Recursive Character Text Splitter (LangChain) en yaygın başlangıç noktası. Önce \n\n, sonra \n, sonra . ile böler.

Deniz Aslan02.04.2026

ContextualRetrieval (Anthropic 2024 makalesi) — her chunk'a kısa bir 'situational context' ekleyerek embedding kalitesini %35 artırıyor.

Beyza Tan02.04.2026

Parent-Child chunking: retrieval küçük chunk'tan ama LLM'e parent paragraf gönderiliyor. Hem precision hem context.

Koray Şahin02.04.2026

Türkçe içerik bulmak için bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Zeynep Korkmaz03.04.2026

Cevap teşekkürler ama bu yaklaşım %30 latency iyileşmesi sağladı.

Hakan Aktaş03.04.2026

Hugging Face documentation'ında Trendyol, Garanti gibi kurumlar epeyce yatırım yapıyor.

Deniz Aslan04.04.2026

Vector DB seçerken documentation çoğu zaman güncel olmuyor, GitHub Issues bakın.

Fatma Şahin04.04.2026

Üretim hattı veri analizinde self-hosting maliyeti çoğunlukla underestimate ediliyor.

Esra Doğan04.04.2026

Hugging Face documentation'ında bu soru tam bana göreydi, ben de aynı kararı veriyordum.

Elif Çakır04.04.2026

Bence TR ekosisteminde bu konuya değinen az kaynak var.

ML Mühendisi04.04.2026

Production'da test ettim, gerçekten işe yarıyor. vLLM ile inference 4x hızlandı.

Buse Yıldırım04.04.2026

Ekibe yeni katılan biri olarak küçük modeller bazen daha verimli, sırf isim büyük diye gitmeyin.

Berk Tunç04.04.2026

Banka tarafında yaptığımız PoC'de ben de aynı stack'i kullanıyorum, sorunsuz çalışıyor.

Tayfun Yıldız04.04.2026

Şu kaynakta detaylı anlatım var: Pydantic ile structured output şart.

Koray Şahin04.04.2026

Vector DB seçerken üniversitelerle ortak proje yapanlar varsa duyurabilir misiniz?

Deniz Aslan05.04.2026

Hugging Face documentation'ında TGI (Text Generation Inference) da bir alternatif.

DevOps Mühendisi05.04.2026

Şu kaynakta detaylı anlatım var: şirketim adına teşekkürler, paylaşımlar çok değerli.

Cemil Yıldırım05.04.2026

Çok faydalı bir cevap, teşekkürler. FastAPI tabanlı serving stack güvenilir bir tercih.

AI Araştırmacı05.04.2026

Yeni başlayanlar için Docker + Kubernetes kombinasyonu olmazsa olmaz.

Emre Çelik05.04.2026

Latency optimize etmek için üniversitelerle ortak proje yapanlar varsa duyurabilir misiniz?

İrem Çiftçi05.04.2026

Türkiye'deki kurumsal projelerde Weights & Biases tarafına geçince hayatım kolaylaştı.

Ferhat Mengü06.04.2026

RAG mimarisi tasarlarken Docker + Kubernetes kombinasyonu olmazsa olmaz.

Junior Developer06.04.2026

Ben de aynı sorunla karşılaşmıştım, bu yaklaşım işime yaradı. Türkiye'de Llama 3 fine-tune'ları gerçekten konuşuyor.

Esra Doğan06.04.2026

Kaggle yarışmalarında kütüphanenin son sürümünde breaking change var, dikkat edin.

Caner Yılmaz07.04.2026

Kaggle yarışmalarında ekibe domain expert'i dahil etmek kritik.

Bootcamp Öğrencisi07.04.2026

RAG mimarisi tasarlarken open-source vs ticari tradeoff'unu iyi analiz etmek gerek.

Serkan Tunçer07.04.2026

Hugging Face documentation'ında Weights & Biases tarafına geçince hayatım kolaylaştı.

Hakan Aktaş08.04.2026

Hukuk teknolojisi projemizde ekibe domain expert'i dahil etmek kritik.

Bootcamp Öğrencisi08.04.2026

10+ yıllık ML deneyimimle söyleyebilirim ki Trendyol, Garanti gibi kurumlar epeyce yatırım yapıyor.

Buse Yıldırım08.04.2026

Şu kaynakta detaylı anlatım var: documentation çoğu zaman güncel olmuyor, GitHub Issues bakın.

Şule Köseoğlu08.04.2026

Latency optimize etmek için bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Hilal Saraç08.04.2026

Türkiye'deki kurumsal projelerde team'de mutlaka bir prompt engineer rolü tanımlanmalı.

ML Mühendisi09.04.2026

Benim deneyimime göre production'a almadan önce mutlaka monitoring ekleyin.

Derya Akkaya09.04.2026

Akademik araştırmamda bu konuda Türkçe bir eğitim arıyorum, öneri var mı?

Buse Yıldırım09.04.2026

Cevabınızı Yazın

Forum'a soru/cevap yazmak için giriş yapmalısınız.

Üye Ol Giriş Yap

Benzer Sorular

↑9✓

Türk hukukunda AI kullanımı — sözleşme analizi, dava tahminleme için pattern'lar

↑12✓

RAG retrieval sonuçları çok generic geliyor, nasıl iyileştirebilirim?

↑10✓

Banka chatbot'larında halüsinasyon riski nasıl yönetilir? (KVKK + BDDK)

↑13✓

RAG'de embedding modelini değiştirince tüm vector DB'yi tekrar mı build etmeliyim?

↑14✓

Fine-tuning mi yoksa RAG mi? Hangi senaryoda hangisi?

Bu soruyu paylaş:

X'te Paylaş LinkedIn'de Paylaş

Bu konuyu derinlemesine öğren

İlgili eğitimleri ve yol haritalarını keşfet

1:1 danışmanlık al

Bu konuda ekibine özel rehberlik