İçeriğe geç
Tüm roadmap'e dön
topicadvanced

Çoklu-Model Orkestrasyonu

Tek model yerine 3-5 modeli rol bazlı çalıştırma — maliyet/kalite optimum nokta.

3 saat1 kaynak1 önkoşul

Production agent'larda klasik pattern: router + planner + executor + judge, her biri farklı model.

  • Router (Haiku/4o-mini): kullanıcı sorusunu sınıflandır, doğru pipeline'a yönlendir. <100ms, ~$0.0001.
  • Planner (Opus thinking / o1): görev kompleks ise plan üret. ~5-30sn, ~$0.05.
  • Executor (Sonnet / 4o): her adımı çalıştır, tool'ları çağır. ~3sn, ~$0.005.
  • Judge (Sonnet): çıktıyı eval et, hata varsa retry tetikle. ~2sn, ~$0.003.

Maliyet karşılaştırması: her şey için Opus = $0.50/istek. Multi-model = $0.08/istek. 6x tasarruf + better quality.

Karmaşıklık: 4 farklı model = 4 farklı SDK call, prompt template, error handling. Framework (LangGraph, Mastra) bu orchestration'ı kolaylaştırır.

Önce bunları bil

Kaynaklar(1)