Tüm roadmap'e dön
topiccore
Reasoning Modelleri ve Agent'lar
o1/o3, Claude thinking, Gemini 2.5 — agentic planning'de devrim ama latency/maliyet 5-10x.
3 saat2 kaynak1 önkoşul
Reasoning model'leri agent'larda iki noktada parlar:
- Planlama — karmaşık görevi alt-adımlara ayırma
- Tool selection — birden fazla doğru-görünür tool arasından en uygunu seçme
Pattern: "Reasoning model as planner, fast model as executor". Örnek: Claude Opus thinking planı kurar (1 çağrı, $0.05), GPT-4o-mini her alt-görevi yürütür (10 çağrı × $0.001).
Trade-off: reasoning model her adımda 10-60sn bekletir. Agent loop 5 adım atıyorsa toplam 1-5 dakika. UX için: streaming + progress indicator + "İlk plan hazır" milestone'u.
Anthropic extended thinking budget: thinking_tokens: 8000 ile model 8K token kadar düşünür. include_thoughts: true ile reasoning'i debug edebilirsin.