Skip to content

Multi-Agent Caching: Shared Context Paylaşımı

Orchestrator + worker agent'ların shared context'i nasıl cache'lediği. CrewAI, AutoGen, LangGraph patterns'ları.

Şükrü Yusuf KAYA
12 min read
Advanced

Multi-Agent Caching: Shared Context

Modern agent sistemler genelde multi-agent: birden çok özelleşmiş agent koordine olur.
[Orchestrator Agent] ├── [Researcher Agent] — bilgi toplar ├── [Coder Agent] — kod yazar ├── [Reviewer Agent] — kontrol eder └── [Reporter Agent] — sunum yapar
Her agent kendi LLM call'u atıyor. Shared context (örn. proje brief, kodbase) hepsi için aynı. Caching'in fırsatı burada.

Multi-Agent Cache Pattern#

Implementation Pattern#

python
# Tüm agent'lar aynı project context'i kullanır → aynı cache prefix
PROJECT_CONTEXT = open("project_brief.md").read() + open("codebase_summary.md").read()
# ~30K token, stabil
 
def researcher_agent(task):
return client.messages.create(
model="claude-sonnet-4-6",
system=[
{"text": PROJECT_CONTEXT, "cache_control": {"ttl": "1h"}}, # ← shared cache key
{"text": RESEARCHER_PROMPT, "cache_control": {"ttl": "5m"}},
],
messages=[{"role": "user", "content": task}],
)
 
def coder_agent(task):
return client.messages.create(
model="claude-sonnet-4-6",
system=[
{"text": PROJECT_CONTEXT, "cache_control": {"ttl": "1h"}}, # ← AYNI prefix
{"text": CODER_PROMPT, "cache_control": {"ttl": "5m"}},
],
messages=[{"role": "user", "content": task}],
)
 
# Anthropic cache: hem researcher hem coder PROJECT_CONTEXT cache hit
# (aynı prefix paylaşılıyor)
Multi-agent shared cache pattern
Cross-Agent Cache Hit
Anthropic cache prefix-based. İki ayrı agent aynı prefix gönderirse cache aynı pool'dan hit yer. Yani 'shared context'i bir kez yazıyorsun, 5+ agent için kullanıyorsun.

Frameworks ve Caching#

Native caching: Yok (custom code gerekir).
Pattern: Agent class'ı içinde manuel system+context cache_control ekleyebilirsin. CrewAI 0.30+ memory backends ile entegrasyon.
Önerilen: Custom LLM wrapper yaz, cache logic'i orada implement et.

Maliyet Etkisi#

4-agent sistemde 1M token shared context:
SenaryoCost per request
Saf (her agent kendi yazar)12(4×1M×12 (4 × 1M × 3/M)
Shared cache3(1write+3read×3 (1 write + 3 read × 0.30/M)
4× tasarruf sadece shared cache ile.

✓ Pekiştir#

Bir Sonraki Derste#

Modül 9 bitirme sınavı.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

Related Content

Connected pillar topics

Pillar topics this article maps to