Skip to content

1, 2, 4 Breakpoint Stratejileri: Hangisi Ne Zaman?

Anthropic'te 1-4 arası cache breakpoint koyabilirsin. Hangi senaryoda hangisi optimaldir? Bu derste 3 strateji karar matrisini ve TTL hesaplarını sistematik öğreneceksin.

Şükrü Yusuf KAYA
12 min read
Intermediate

Breakpoint Sayısı Stratejisi

Anthropic'te 1-4 arası breakpoint koyabilirsin. Daha fazla = daha çok kontrol ama daha karmaşık. Bu derste pragmatik kararı veriyoruz.

1 Breakpoint: En Basit#

Senaryo: Statik bilgi sadece bir blok, multi-turn yok, single-shot QA.
python
system_blocks = [
{"type": "text", "text": KB_AND_SYSTEM, "cache_control": {"type": "ephemeral"}},
]
# Tek breakpoint: KB + system instructions tek blok
# Tools cache'lemiyoruz, history yok
1 breakpoint — en basit
Ne zaman: Stateless FAQ bot, document QA, single-call summarization.
Tasarruf: %75-90 (KB büyükse).
Karmaşıklık: Sıfır.

2 Breakpoint: Tools'lı Asistan#

python
system_blocks = [
{"type": "text", "text": KB_AND_SYSTEM, "cache_control": {"type": "ephemeral"}},
]
tools = [
*TOOLS[:-1],
{**TOOLS[-1], "cache_control": {"type": "ephemeral"}},
]
# 2 breakpoint: system + tools ayrı cache
# Tools nadir değişir, system biraz daha sık
2 breakpoint — tool kullanan asistan
Ne zaman: Tool-calling asistanlar, tek-turn workflows.
Avantaj: Tools 1 ayda değişse de system her hafta değişebilir. Ayrı breakpoint'lerle sadece değişen kısım yeniden write.
Karmaşıklık: Düşük.

4 Breakpoint: Production-Grade Multi-Turn#

Senaryo: Production asistan, multi-turn, multi-tier statik içerik.
python
system_blocks = [
# Breakpoint 1: KB (1h TTL — uzun yaşa)
{"type": "text", "text": KB, "cache_control": {"type": "ephemeral", "ttl": "1h"}},
# Breakpoint 3: System instructions (5m TTL — orta sıklık)
{"type": "text", "text": SYSTEM, "cache_control": {"type": "ephemeral", "ttl": "5m"}},
]
tools = [
*TOOLS[:-1],
# Breakpoint 2: Tool definitions (1h TTL)
{**TOOLS[-1], "cache_control": {"type": "ephemeral", "ttl": "1h"}},
]
# Breakpoint 4: Conversation history (5m TTL)
messages = [
*history[:-1],
{"role": "user", "content": [
{"type": "text", "text": history[-1].content,
"cache_control": {"type": "ephemeral", "ttl": "5m"}}
]},
{"role": "user", "content": NEW_QUERY},
]
4 breakpoint — production multi-turn
Ne zaman: Chatbot'lar, AI copilot'lar, multi-turn conversation, kullanıcı oturumları olan asistanlar.
Avantaj: Her katmanın TTL'i değişim hızına göre. Hiçbiri gereksiz yeniden write etmez.
Karmaşıklık: Orta. Cache_control'leri doğru yere koymak ve TTL'leri dengelemek lazım.

Trade-Off Analizi#

StratejiCache Hit RateCost OptimizasyonuKod Karmaşıklığıİdeal Senaryo
1 breakpoint%70-85İyiDüşükSingle-shot QA
2 breakpoint%85-92Çok İyiOrtaTool-using single-turn
4 breakpoint%92-98MükemmelOrta-YüksekMulti-turn production
3 breakpoint (intermediate)%88-95Çok İyiOrtaÇoğu senaryo için ideal
Aşamalı Yaklaşım
Pragmatik öneri: Production'a 1 breakpoint ile başla, ölç. Hit rate %85 altındaysa 2'ye çık. Hâlâ %90 altındaysa 4'e çık. Premature optimization yapma.

TTL Kombinasyonları#

En sık görülen kombinasyonlar:
Kombo A — Yoğun Trafik (saatlik 1000+ istek)
  • Tüm breakpoint'ler 5m TTL
  • Trafik yoğun olduğu için cache hep sıcak
  • Yazma maliyeti düşük (1.25× input)
Kombo B — Düşük-Orta Trafik (saatlik 50-200)
  • KB ve tools: 1h TTL
  • System ve history: 5m TTL
  • 1h ile KB cache miss'lerini önle, 5m ile sık değişeni ekonomik tut
Kombo C — Çok Seyrek Trafik (saatlik <30)
  • Tüm breakpoint'ler 1h TTL
  • 5m sürekli expire olur, 1h dayanır
  • Yazma maliyeti yüksek (2×) ama 1 yazıp 30+ kullanıyorsun

Mini Egzersiz#

Boşluk doldur · text
Senaryo: Türk bankasının müşteri hizmetleri chatbot'u. Trafik saatte ~500 istek.
KB 30K token (politikalar, ürün katalogu). Tools 5 adet. Kullanıcılar 3-5 turn diyalog yapar.

Strateji önerisi:
- Breakpoint sayısı: ____
- KB TTL: ____
- Tools TTL: ____
- System TTL: ____
- History TTL: ____

✓ Pekiştir#

Bir Sonraki Derste#

Pratik: kötü prompt yapılandırması (%5 hit) → iyi yapılandırma (%92 hit). Yan yana, gerçek dolar farkıyla.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

Related Content

Connected pillar topics

Pillar topics this article maps to