1, 2, 4 Breakpoint Stratejileri: Hangisi Ne Zaman?
Anthropic'te 1-4 arası cache breakpoint koyabilirsin. Hangi senaryoda hangisi optimaldir? Bu derste 3 strateji karar matrisini ve TTL hesaplarını sistematik öğreneceksin.
Şükrü Yusuf KAYA
12 min read
IntermediateBreakpoint Sayısı Stratejisi
Anthropic'te 1-4 arası breakpoint koyabilirsin. Daha fazla = daha çok kontrol ama daha karmaşık. Bu derste pragmatik kararı veriyoruz.
1 Breakpoint: En Basit#
Senaryo: Statik bilgi sadece bir blok, multi-turn yok, single-shot QA.
python
system_blocks = [ {"type": "text", "text": KB_AND_SYSTEM, "cache_control": {"type": "ephemeral"}},]# Tek breakpoint: KB + system instructions tek blok# Tools cache'lemiyoruz, history yok1 breakpoint — en basit
Ne zaman: Stateless FAQ bot, document QA, single-call summarization.
Tasarruf: %75-90 (KB büyükse).
Karmaşıklık: Sıfır.
2 Breakpoint: Tools'lı Asistan#
python
system_blocks = [ {"type": "text", "text": KB_AND_SYSTEM, "cache_control": {"type": "ephemeral"}},]tools = [ *TOOLS[:-1], {**TOOLS[-1], "cache_control": {"type": "ephemeral"}},]# 2 breakpoint: system + tools ayrı cache# Tools nadir değişir, system biraz daha sık2 breakpoint — tool kullanan asistan
Ne zaman: Tool-calling asistanlar, tek-turn workflows.
Avantaj: Tools 1 ayda değişse de system her hafta değişebilir. Ayrı breakpoint'lerle sadece değişen kısım yeniden write.
Karmaşıklık: Düşük.
4 Breakpoint: Production-Grade Multi-Turn#
Senaryo: Production asistan, multi-turn, multi-tier statik içerik.
python
system_blocks = [ # Breakpoint 1: KB (1h TTL — uzun yaşa) {"type": "text", "text": KB, "cache_control": {"type": "ephemeral", "ttl": "1h"}}, # Breakpoint 3: System instructions (5m TTL — orta sıklık) {"type": "text", "text": SYSTEM, "cache_control": {"type": "ephemeral", "ttl": "5m"}},]tools = [ *TOOLS[:-1], # Breakpoint 2: Tool definitions (1h TTL) {**TOOLS[-1], "cache_control": {"type": "ephemeral", "ttl": "1h"}},]# Breakpoint 4: Conversation history (5m TTL)messages = [ *history[:-1], {"role": "user", "content": [ {"type": "text", "text": history[-1].content, "cache_control": {"type": "ephemeral", "ttl": "5m"}} ]}, {"role": "user", "content": NEW_QUERY},]4 breakpoint — production multi-turn
Ne zaman: Chatbot'lar, AI copilot'lar, multi-turn conversation, kullanıcı oturumları olan asistanlar.
Avantaj: Her katmanın TTL'i değişim hızına göre. Hiçbiri gereksiz yeniden write etmez.
Karmaşıklık: Orta. Cache_control'leri doğru yere koymak ve TTL'leri dengelemek lazım.
Trade-Off Analizi#
| Strateji | Cache Hit Rate | Cost Optimizasyonu | Kod Karmaşıklığı | İdeal Senaryo |
|---|---|---|---|---|
| 1 breakpoint | %70-85 | İyi | Düşük | Single-shot QA |
| 2 breakpoint | %85-92 | Çok İyi | Orta | Tool-using single-turn |
| 4 breakpoint | %92-98 | Mükemmel | Orta-Yüksek | Multi-turn production |
| 3 breakpoint (intermediate) | %88-95 | Çok İyi | Orta | Çoğu senaryo için ideal |
Aşamalı Yaklaşım
Pragmatik öneri: Production'a 1 breakpoint ile başla, ölç. Hit rate %85 altındaysa 2'ye çık. Hâlâ %90 altındaysa 4'e çık. Premature optimization yapma.
TTL Kombinasyonları#
En sık görülen kombinasyonlar:
Kombo A — Yoğun Trafik (saatlik 1000+ istek)
- Tüm breakpoint'ler 5m TTL
- Trafik yoğun olduğu için cache hep sıcak
- Yazma maliyeti düşük (1.25× input)
Kombo B — Düşük-Orta Trafik (saatlik 50-200)
- KB ve tools: 1h TTL
- System ve history: 5m TTL
- 1h ile KB cache miss'lerini önle, 5m ile sık değişeni ekonomik tut
Kombo C — Çok Seyrek Trafik (saatlik <30)
- Tüm breakpoint'ler 1h TTL
- 5m sürekli expire olur, 1h dayanır
- Yazma maliyeti yüksek (2×) ama 1 yazıp 30+ kullanıyorsun
Mini Egzersiz#
Boşluk doldur · text
Senaryo: Türk bankasının müşteri hizmetleri chatbot'u. Trafik saatte ~500 istek.
KB 30K token (politikalar, ürün katalogu). Tools 5 adet. Kullanıcılar 3-5 turn diyalog yapar.
Strateji önerisi:
- Breakpoint sayısı: ____
- KB TTL: ____
- Tools TTL: ____
- System TTL: ____
- History TTL: ____✓ Pekiştir#
Bir Sonraki Derste#
Pratik: kötü prompt yapılandırması (%5 hit) → iyi yapılandırma (%92 hit). Yan yana, gerçek dolar farkıyla.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
Related Content
1. Temeller — Context Penceresi Ekonomisi
Bu Eğitim Hakkında ve Prompt Caching Neden Önemli?
Start Learning1. Temeller — Context Penceresi Ekonomisi
Token Ekonomisi 101: Input vs Output Cost Asimetrisi
Start Learning1. Temeller — Context Penceresi Ekonomisi
Context Window Evrimi: 4K'dan 1M'a 5 Yılda Ne Oldu?
Start LearningConnected pillar topics