ReAct vs Plan-and-Execute: Caching Açısından Karşılaştırma
Agent reasoning'in iki temel paradigması: ReAct (step-by-step) ve Plan-and-Execute (plan first). Caching açısından hangisi avantajlı?
Şükrü Yusuf KAYA
12 min read
AdvancedReAct vs Plan-and-Execute
Agent reasoning iki ana paradigmaya sahip. Caching impact farklı.
Pattern: Düşün → Eylem → Gözle → Tekrarla
Her adımda:
- Modele context'i gönder
- Model "düşünür" + bir tool çağırır
- Tool result'ı al
- Modele tekrar gönder
Avantaj: Adaptive, gözleme göre revize edilebilir
Dezavantaj: Her adımda LLM call, çok turn
Caching: Multi-turn yapısı doğal. %90+ hit rate mümkün.
Caching Analizi#
ReAct İçin Caching#
Multi-turn caching (Modül 8) tamamen uygulanır:
Adım 1: System + Tools cache write Adım 2: cache hit (system + tools + tool result 1) ... Adım N: cache hit (büyüyen prefix)
Tahmini hit rate: %92-98 (Modül 8 gibi).
Plan-and-Execute İçin Caching#
İki ayrı pattern:
Planning call: Tek seferlik, küçük context, basit cache (sadece system).
Execution calls: Her adımda farklı tool call. Statik prefix (system + plan + tool defs) cache, dinamik tool result her sefer farklı.
python
# Plan-and-Execute cachingdef plan(user_query): return client.messages.create( system=[{"text": PLANNING_PROMPT, "cache_control": {"ttl": "1h"}}], messages=[{"role": "user", "content": user_query}], ) def execute(plan_steps, step_idx): # Her execution call için system + plan + tools cache'le return client.messages.create( system=[ {"text": EXECUTOR_PROMPT, "cache_control": {"ttl": "1h"}}, {"text": f"Plan:\n{plan_steps}", "cache_control": {"ttl": "5m"}}, # plan stabil olduğu sürece ], tools=tools, messages=[{"role": "user", "content": f"Şu adımı yap: {step_idx}"}], )Plan-and-Execute caching
Hangisi Daha İyi?#
| Boyut | ReAct | Plan-and-Execute |
|---|---|---|
| Cache hit rate | %92-98 | %85-90 |
| Total LLM call | N (adım sayısı) | 1 + N |
| Latency | Yüksek (N round-trip) | Düşük (1 büyük + N küçük) |
| Adaptiveness | Yüksek | Düşük |
| Cost | Caching ile düşük | Plan call ek maliyet |
| Production yaygınlığı | Yüksek (LangChain, LangGraph) | Orta |
Tavsiye:
- Bilinmeyen/adaptive görevler → ReAct
- Belirli workflow'lar → Plan-and-Execute
- Hibrit (modern): Plan-first sonra ReAct execution → en iyi caching
✓ Pekiştir#
Bir Sonraki Derste#
Pratik: 10 adımlı bir agent'ı caching ile %85 ucuzlat.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
Related Content
1. Temeller — Context Penceresi Ekonomisi
Bu Eğitim Hakkında ve Prompt Caching Neden Önemli?
Start Learning1. Temeller — Context Penceresi Ekonomisi
Token Ekonomisi 101: Input vs Output Cost Asimetrisi
Start Learning1. Temeller — Context Penceresi Ekonomisi
Context Window Evrimi: 4K'dan 1M'a 5 Yılda Ne Oldu?
Start LearningConnected pillar topics