LLM Beyin Seçimi (Claude vs GPT vs Gemini vs OSS)
Agent için model seçimi kritik — her vendor'un agent context'inde güçlü/zayıf yönleri farklı.
Claude (Anthropic): tool use'da güçlü, XML semantic anlayışı yüksek, "reasoning" + "thinking" mode. Long-context (200K-1M) lider. Agentic IDE/Computer use için referans. Pahalı (Opus) ama production-ready.
GPT (OpenAI): function calling olgun, structured output zorlama (response_format) güçlü. o1/o3 reasoning models. Realtime API ses agent'lar için.
Gemini (Google): native multimodal (video, audio dahil), 2M context, ucuz. Tool use OK ama Claude/GPT kadar fine-tuned değil.
Llama / Mistral / Qwen / DeepSeek (open-source): on-premise + privacy. Function calling sınırlı (Llama 3.1+ destekler). vLLM ile self-host.
Karar matrisi: complex multi-step tool use → Claude / o1. Speed-critical structured output → GPT-4o / Gemini Flash. Privacy → Llama 3.1 70B. Edge → Llama 3.2 3B / Phi-4.