Tüm roadmap'e dön
topicadvanced
Çoklu-Model Orkestrasyonu
Tek model yerine 3-5 modeli rol bazlı çalıştırma — maliyet/kalite optimum nokta.
3 saat1 kaynak1 önkoşul
Production agent'larda klasik pattern: router + planner + executor + judge, her biri farklı model.
- Router (Haiku/4o-mini): kullanıcı sorusunu sınıflandır, doğru pipeline'a yönlendir. <100ms, ~$0.0001.
- Planner (Opus thinking / o1): görev kompleks ise plan üret. ~5-30sn, ~$0.05.
- Executor (Sonnet / 4o): her adımı çalıştır, tool'ları çağır. ~3sn, ~$0.005.
- Judge (Sonnet): çıktıyı eval et, hata varsa retry tetikle. ~2sn, ~$0.003.
Maliyet karşılaştırması: her şey için Opus = $0.50/istek. Multi-model = $0.08/istek. 6x tasarruf + better quality.
Karmaşıklık: 4 farklı model = 4 farklı SDK call, prompt template, error handling. Framework (LangGraph, Mastra) bu orchestration'ı kolaylaştırır.