İçeriğe geç
Tüm roadmap'e dön
topiccore

Reasoning Modelleri ve Agent'lar

o1/o3, Claude thinking, Gemini 2.5 — agentic planning'de devrim ama latency/maliyet 5-10x.

3 saat2 kaynak1 önkoşul

Reasoning model'leri agent'larda iki noktada parlar:

  1. Planlama — karmaşık görevi alt-adımlara ayırma
  2. Tool selection — birden fazla doğru-görünür tool arasından en uygunu seçme

Pattern: "Reasoning model as planner, fast model as executor". Örnek: Claude Opus thinking planı kurar (1 çağrı, $0.05), GPT-4o-mini her alt-görevi yürütür (10 çağrı × $0.001).

Trade-off: reasoning model her adımda 10-60sn bekletir. Agent loop 5 adım atıyorsa toplam 1-5 dakika. UX için: streaming + progress indicator + "İlk plan hazır" milestone'u.

Anthropic extended thinking budget: thinking_tokens: 8000 ile model 8K token kadar düşünür. include_thoughts: true ile reasoning'i debug edebilirsin.

Önce bunları bil

Kaynaklar(2)