Multi-Agent Caching: Shared Context Paylaşımı
Orchestrator + worker agent'ların shared context'i nasıl cache'lediği. CrewAI, AutoGen, LangGraph patterns'ları.
Şükrü Yusuf KAYA
12 min read
AdvancedMulti-Agent Caching: Shared Context
Modern agent sistemler genelde multi-agent: birden çok özelleşmiş agent koordine olur.
[Orchestrator Agent] ├── [Researcher Agent] — bilgi toplar ├── [Coder Agent] — kod yazar ├── [Reviewer Agent] — kontrol eder └── [Reporter Agent] — sunum yapar
Her agent kendi LLM call'u atıyor. Shared context (örn. proje brief, kodbase) hepsi için aynı. Caching'in fırsatı burada.
Multi-Agent Cache Pattern#
Implementation Pattern#
python
# Tüm agent'lar aynı project context'i kullanır → aynı cache prefixPROJECT_CONTEXT = open("project_brief.md").read() + open("codebase_summary.md").read()# ~30K token, stabil def researcher_agent(task): return client.messages.create( model="claude-sonnet-4-6", system=[ {"text": PROJECT_CONTEXT, "cache_control": {"ttl": "1h"}}, # ← shared cache key {"text": RESEARCHER_PROMPT, "cache_control": {"ttl": "5m"}}, ], messages=[{"role": "user", "content": task}], ) def coder_agent(task): return client.messages.create( model="claude-sonnet-4-6", system=[ {"text": PROJECT_CONTEXT, "cache_control": {"ttl": "1h"}}, # ← AYNI prefix {"text": CODER_PROMPT, "cache_control": {"ttl": "5m"}}, ], messages=[{"role": "user", "content": task}], ) # Anthropic cache: hem researcher hem coder PROJECT_CONTEXT cache hit# (aynı prefix paylaşılıyor)Multi-agent shared cache pattern
Cross-Agent Cache Hit
Anthropic cache prefix-based. İki ayrı agent aynı prefix gönderirse cache aynı pool'dan hit yer. Yani 'shared context'i bir kez yazıyorsun, 5+ agent için kullanıyorsun.
Frameworks ve Caching#
Native caching: Yok (custom code gerekir).
Pattern: Agent class'ı içinde manuel system+context cache_control ekleyebilirsin. CrewAI 0.30+ memory backends ile entegrasyon.
Önerilen: Custom LLM wrapper yaz, cache logic'i orada implement et.
Maliyet Etkisi#
4-agent sistemde 1M token shared context:
| Senaryo | Cost per request |
|---|---|
| Saf (her agent kendi yazar) | 3/M) |
| Shared cache | 0.30/M) |
4× tasarruf sadece shared cache ile.
✓ Pekiştir#
Bir Sonraki Derste#
Modül 9 bitirme sınavı.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
Related Content
1. Temeller — Context Penceresi Ekonomisi
Bu Eğitim Hakkında ve Prompt Caching Neden Önemli?
Start Learning1. Temeller — Context Penceresi Ekonomisi
Token Ekonomisi 101: Input vs Output Cost Asimetrisi
Start Learning1. Temeller — Context Penceresi Ekonomisi
Context Window Evrimi: 4K'dan 1M'a 5 Yılda Ne Oldu?
Start LearningConnected pillar topics