AI Agent Nedir? Otonom Yapay Zeka Mimarileri 2026 — Uçtan Uca Kapsamlı Rehber
AI Agent'ların 2026'da nasıl çalıştığını, hangi mimarilerin neyi çözdüğünü, Türk şirketleri için ne anlama geldiğini uçtan uca açıklayan ultra kapsamlı bir referans. ReAct, multi-agent, MCP, tool use, computer use, browser agent'lar, LangGraph / AutoGen / CrewAI / Claude Code framework'leri, üretim endişeleri, eval, güvenlik, KVKK uyumu ve 3 anonim Türk şirketi vaka çalışması.
Tek cümlelik cevap: AI Agent, LLM’in cevap verme yeteneğine plan yapma ve araç kullanma katmanlarını ekleyen — birden çok adımda otonom iş yürütebilen — yeni nesil yapay zeka sistem mimarisidir.
- AI Agent, bir hedefe ulaşmak için ortamı algılayan, plan yapan, araç kullanan ve eylem alan otonom AI sistemidir — geleneksel LLM cevap üretmekle kalır, agent eylem alır.
- Bir agent dört bileşenden oluşur: LLM beyni, hafıza (kısa+uzun), planner ve tool/executor. Bu dördünün döngülü işlemesi otonomluk üretir.
- 2026 ekosistemi: tek-agent (ReAct), supervisor (LangGraph), multi-agent collaboration (AutoGen/CrewAI), browser & computer use (Operator, Claude Computer Use). MCP standartlaşan tool entegrasyonu protokolü.
- Agent'lar token maliyetini 10-100x artırabilir; üretim için eval, observability, guardrails ve insan-onay (HITL) süreçleri olmadan ölçeklenemezler.
- KVKK ve EU AI Act kapsamında otonom karar veren agent'lar yüksek risk kategorisinde değerlendirilir; insan denetimi, audit log ve kayıt tutma zorunludur.
1. AI Agent Nedir? — Tek Cümlelik Cevap ve Uzun Tanım
LLM ile AI Agent arasındaki temel fark, basit bir cümleyle özetlenebilir: LLM cevap üretir; Agent eylem alır. Bir LLM ChatGPT pencerenizde size cevap verirken, bir Agent aynı sorguyla bir araştırma yapar, e-posta gönderir, dosya düzenler, CRM'de kayıt açar — ve bunu tek seferde değil çoklu-adımlı bir plan üzerinden gerçekleştirir.
- AI Agent
- Belirli bir hedefi gerçekleştirmek için ortamı algılayan, plan yapan, araç (tool) kullanan ve eylemler alan otonom AI sistemi. Tipik mimarisi: hedef + LLM beyni + araç kataloğu + hafıza + döngüsel karar verme. Reaktif değil proaktif; tek-adımlı değil çok-adımlı; deterministik değil hedef-yönelimli.
- Ayrıca: Agentic AI, Autonomous AI, LLM Agent
Bu fark bilim kurgu değildir; 2024-2026 döneminde production'da gözlenen somut bir paradigma kaymasıdır. Claude Code, GitHub Copilot Workspace, Cursor Agent, Replit Agent, Devin, OpenAI Operator, Anthropic Computer Use, Microsoft Copilot Studio — hepsi bu paradigmanın somut ürünleri.
Geleneksel LLM Çağrısı vs Agent
Geleneksel kullanım: "Bu PDF'i özetle" → tek bir prompt, tek bir cevap. Agent kullanımı: "Müşterinin son 6 aylık siparişlerini analiz et, en sık aldığı ürün kategorisinin geçen ay stoğu yetersizse satın alma talebi oluştur" → ajan veritabanını sorgular, tabloları analiz eder, stok sistemini kontrol eder, satın alma talebi açar, e-posta gönderir.
2. AI Agent'ın Anatomisi: Dört Çekirdek Bileşen
Bir AI Agent'ı oluşturan dört temel bileşen vardır. Bu dördünü ayrı ayrı tasarlamadan dayanıklı bir agent kurmak mümkün değildir.
2.1. LLM Beyni
Agent'ın akıl yürüten ve karar veren çekirdek motoru. 2026 itibarıyla bayrak agent modelleri:
- Claude Opus 4.7 — uzun bağlam (1M), tool use, agent kullanımında lider; Anthropic'in agent-centric eğitim odağı
- GPT-5 — function calling, multi-step reasoning, OpenAI Operator entegrasyonu
- Gemini 3 Pro — multimodal agent görevleri, Google Workspace entegrasyonu
- Açık alternatif — Llama 4 70B, DeepSeek V3, Qwen 2.5 (tool use destekli)
2.2. Hafıza (Memory)
Bir agent'ın "geçmişi hatırlaması" iki katmanda gerçekleşir:
- Kısa süreli hafıza (short-term): Aktif görev boyunca context window içinde tutulan konuşma geçmişi, ara çıktılar, plan durumu.
- Uzun süreli hafıza (long-term): Vektör DB üzerinde tutulan geçmiş etkileşimler, kullanıcı tercihleri, organizasyonel bilgi. Genelde RAG mimarisi ile entegre edilir.
- Agent Memory
- Bir AI agent'ın görevler arası ve görev içi bilgi tutma katmanı. Kısa süreli hafıza context window'da yaşar; uzun süreli hafıza vektör DB veya yapılandırılmış veritabanında saklanır. Epizodik (yaşanan olaylar), semantik (öğrenilen bilgiler) ve prosedürel (öğrenilen iş akışları) alt-türleri olabilir.
Üç Memory Türü ve Pratik Uygulama
- Epizodik hafıza: "Geçen hafta müşteri X ile şu sohbeti yapmıştık" tarzı zaman-bağlamlı olaylar. Vektör DB + timestamp metadata tipik mimari.
- Semantik hafıza: "Müşterinin tercih ettiği iletişim kanalı e-posta" tarzı çıkarsanmış kararlı bilgiler. Genelde structured DB (Postgres, MongoDB) içinde.
- Prosedürel hafıza: "Bu sektörde fatura itirazı yanıtı şu adımlardan oluşur" tarzı öğrenilmiş iş akışları. Tipik olarak prompt şablonu + örnek-bazlı few-shot referansları.
Memory Framework'leri
- Mem0 — açık kaynak, otomatik fact extraction + retrieval
- Zep — kullanıcı bazlı uzun-süreli memory + temporal graph
- LangMem — LangChain memory yönetimi (semantic + episodic karışımı)
- Letta (eski MemGPT) — virtual context (uzun-bağlam simülasyonu)
2.3. Planner
Agent'a "şimdi ne yapacağım?" sorusunu cevaplatan bileşen. Pratikte üç ana strateji kullanılır:
- Chain-of-Thought (CoT): "Adım adım düşün" prompt'u ile model kendi muhakemesini açıklar.
- ReAct (Reason + Act): Düşünce → Eylem → Gözlem → Düşünce döngüsü. Modern agent'ların en yaygın temel deseni.
- Tree-of-Thoughts (ToT): Birden çok plan dalı oluştur, en iyiyi seç. Karmaşık problem çözümünde kalite artırır ama maliyet 3-10x.
- Plan-and-Solve: Önce tüm planı çıkar (planning), sonra adım adım uygula (solving). Plan ve yürütme ayrımı eval'i kolaylaştırır; planı insan onayına sunmak için ideal.
- ReWOO (Reasoning WithOut Observation): Tool çıktısını beklemeden planı çoklu adım olarak kuran, sonra paralel yürüten yaklaşım. Bağımsız adımlar paralelleşince gecikme %40-60 azalır.
- Self-Discover: Modelin verili problem için kendi muhakeme yapısını keşfetmesini sağlayan yöntem (Google DeepMind, 2024). Karmaşık problemlerde +%10-25 kalite kazanımı raporlandı.
- Reflexion: Hata yapan agent'ın kendi hatasını analiz edip bir sonraki denemede düzeltmesi. Test/kod-yazma görevlerinde tek adım iyileştirme % 20+ olabilir; ama döngüye girme riski için max-iter sınırı şart.
- Graph-of-Thoughts (GoT): ToT'nin genelleştirilmiş hâli — fikirler arasında geri besleme bağlantıları. Akademik araştırma aşamasında, production'a tipik olarak gerek yok.
2.4. Tool / Executor
Agent'ın dış dünyaya etki ettiği katman. Tool kataloğu tipik olarak şunları içerir:
- API çağrıları — CRM, ERP, ticket sistemi, hesaplama servisleri
- Veritabanı sorguları — SQL, vektör arama
- Dosya sistemi işlemleri — okuma, yazma, dönüştürme
- Web — tarayıcı, arama API'leri
- Kod yürütme — Python sandbox, JavaScript runtime
- İletişim — e-posta gönderme, Slack mesajı, Teams notification
- MCP sunucuları — standartlaştırılmış üçüncü taraf tool entegrasyonu
3. Agent Karar Döngüsü: Bir Görev Nasıl Yürütülür?
Bir agent görevini şu döngüde tamamlar:
Tipik AI Agent Karar Döngüsü
Bir agent'ın hedeften tamamlamaya kadar adımları.
- 1
1. Hedef Yorumlama
Kullanıcının doğal dil talebi anlaşılabilir alt-hedefler olarak parçalanır.
- 2
2. Plan Oluşturma
LLM bir plan yapar: hangi araçları, hangi sırayla, hangi parametrelerle çağıracak?
- 3
3. Tool Seçimi
Plana göre ilk eylem için uygun tool seçilir; argümanlar yapılandırılır.
- 4
4. Yürütme
Tool çağrılır; sonuç (output, hata, exception) ele alınır.
- 5
5. Gözlem ve Refleksiyon
Sonuç değerlendirilir: hedefe yaklaştık mı, plan değişmeli mi?
- 6
6. Plan Güncelleme veya Sonlandırma
Hedef tamamlandıysa cevap üretilir; aksi halde döngüye geri dönülür.
- 7
7. Hafıza Yazımı
Görev sonunda epizodik hafızaya kayıt yapılır; gelecek görevler için bağlam korunur.
Bu döngünün bir iterasyonu tek bir LLM çağrısı değildir — tipik bir agent görevi 5-50 LLM çağrısı arasında değişebilir. Maliyet ve gecikme yönetimi bu yüzden kritiktir.
4. Agent Mimari Kalıpları (5 Pattern)
Tek bir doğru agent mimarisi yoktur; problem yapısına göre tercih edilen 5 ana pattern bulunur.
4.1. Tek Agent (Single Agent)
En basit form. Bir LLM, bir tool kataloğu, ReAct döngüsü. Müşteri hizmetleri chatbot'u, iç verimlilik aracı, kişisel asistan gibi sınırlı kapsamlı görevler için ideal.
| Boyut | Tek Agent | Multi-Agent |
|---|---|---|
| Karmaşıklık | Tek-domain görevler | Çoklu uzmanlık alanı |
| Maliyet | Düşük | Yüksek (token çoğalır) |
| Eval | Görece kolay | Çok zor |
| Debug | Doğrudan | İletişim izleme gerekir |
| Hata payı | Düşük | Yüksek (kaskat hatalar) |
4.2. Supervisor (Orkestrasyon)
Bir "yönetici" agent (supervisor), alt görevleri uzmanlaşmış sub-agent'lara delege eder ve sonuçları birleştirir. Bu pattern, LangGraph'ın bayrak kalıbıdır ve 2025-2026 üretim sistemlerinin en yaygın multi-agent yapısıdır.
Tipik yapı:
- Supervisor: hedefi anlayıp uygun sub-agent'ı seçer
- Researcher: web/RAG ile bilgi toplar
- Analyzer: veri analizi yapar
- Writer: rapor/cevap yazar
- Critic: çıktıyı değerlendirir
4.3. Hierarchical (Hiyerarşik)
Supervisor'ın supervisor'u olan, ağaç yapılı agent organizasyonu. Çok karmaşık projeler (örn. otonom yazılım geliştirme — Devin) bu yapıyı kullanır.
4.4. Swarm (Sürü)
Eş-düzey ajanların paralel çalışıp birbirlerinin çıktısını referans alması. OpenAI'ın "Swarm" framework'ü ve CrewAI'ın "process" modu bu yaklaşımı destekler.
4.5. Network (A2A — Agent-to-Agent)
Agent'lar bağımsız servisler olarak ağ üzerinden iletişim kurar. 2025 sonu / 2026 başında A2A protokolü standartlaşma çalışmaları başladı (Google'ın A2A inisiyatifi). Henüz erken aşama ama bir sonraki büyük adım.
4.6. Agent vs Workflow vs RAG vs Fine-tuning — Karar Matrisi
Her problem agent ile çözülmez. Aşağıdaki matris, doğru aracı seçmenize yardımcı olur.
| İhtiyaç | Workflow | RAG | Agent | Fine-tuning |
|---|---|---|---|---|
| Deterministik çoklu adım | ✓ İdeal | - | - | - |
| Güncel bilgiye erişim | - | ✓ İdeal | Kısmi | - |
| Belgeden cevap üretme | - | ✓ İdeal | - | - |
| Dinamik karar verme | - | - | ✓ İdeal | - |
| Çoklu tool kullanımı | Sınırlı | - | ✓ İdeal | - |
| Stil/format kilitleme | - | - | - | ✓ İdeal |
| Düşük maliyet | ✓ | ✓ | Maliyetli | Tek seferlik |
| Debug kolaylığı | Yüksek | Orta | Düşük | Düşük |
| Üretime hız | Hafta | Hafta-ay | Ay-çeyrek | Çeyrek |
Hibrit Yaklaşım — Yaygın Üretim Mimarisi:
Çoğu olgun üretim sistemi dördünü birlikte kullanır:
- Workflow: deterministik ana akışı yönetir (örn. sipariş işleme adımları)
- RAG: bilgi sorularına cevap verir (örn. ürün katalog, mevzuat)
- Agent: dinamik karar gerektiren noktalar (örn. müşteri itirazı triage)
- Fine-tuning: marka tonu ve format şablonu
5. Çekirdek Yetkinlikler: Bir Agent Neler Yapabilir?
Modern agent'ların pratik yetenekleri beş ana kategoriye ayrılır.
5.1. Tool Use / Function Calling
Agent'ın yapılandırılmış API çağrıları yapması. OpenAI Function Calling (Aralık 2023), Anthropic Tool Use (Mart 2024), Gemini Function Calling — hepsi aynı amaca hizmet eder: LLM'in JSON formatında parametreli fonksiyon çağrısı üretmesi.
5.2. Code Execution
Agent'ın güvenli bir sandbox'ta Python (en yaygın) çalıştırması. ChatGPT Code Interpreter / Advanced Data Analysis, Claude'un "execute code" toolu, Replit Agent gibi sistemler bu yetkinliği kullanır. Veri analizi, hesaplama, dönüştürme görevlerinde gücün ana kaynağı.
5.3. Web Browsing
Agent'ın gerçek web tarayıcısını veya arama API'sini kullanarak güncel bilgi toplaması. OpenAI'ın "Browse" özelliği, Anthropic Claude'un Web Search'ü, Gemini Deep Research bu kategoride. Knowledge cutoff sorununu çözer.
5.4. Computer Use
Agent'ın bir bilgisayarın ekranını "görerek" fare ve klavye eylemleriyle uygulamaları kullanması. Anthropic Claude Computer Use (Ekim 2024) ile mainstream'e girdi; OpenAI Operator (Ocak 2025) rakip ürünü. Otonom süreç otomasyonunun yeni nesli.
5.5. Multi-Modal Algılama
Görüntü, ses, video anlama yetkinliği agent'ın "duyularını" genişletir. Bir agent ekran görüntüsündeki hata mesajını okuyabilir, müşteri sesini transkripte çevirebilir, video sunumun anahtar dakikalarını çıkarabilir.
6. Popüler Agent Framework'leri
Hangi framework'ü seçeceğiniz, agent'ınızın karmaşıklığı, üretim hedefiniz ve ekibinizin yetkinliklerine bağlıdır.
| Framework | Sağlayıcı | Güçlü Tarafı | Üretim Olgunluğu | Türkçe Doküman |
|---|---|---|---|---|
| LangGraph | LangChain | Stateful, supervisor pattern, çıktı kontrolü | Yüksek | Sınırlı |
| AutoGen | Microsoft | Multi-agent conversation, code execution | Yüksek | Sınırlı |
| CrewAI | CrewAI Inc. | Hızlı prototip, rol-tabanlı agent | Orta-yüksek | Sınırlı |
| OpenAI Agents SDK | OpenAI | Operator, native function calling, Assistants v2 | Yüksek | Sınırlı |
| Anthropic + Claude Code | Anthropic | Computer use, kod yazma, MCP native | Yüksek | Sınırlı |
| Vercel AI SDK | Vercel | JS/TS, streaming, Next.js native | Yüksek | Var |
| Smolagents | Hugging Face | Hafif, açık kaynak | Orta | Yok |
| Agency Swarm | Topluluk | OpenAI Swarm üzerine inşa | Orta | Yok |
| Semantic Kernel | Microsoft | Plugin-based, .NET/Python | Orta | Sınırlı |
| PydanticAI | Pydantic | Type-safe, schema-first | Orta | Yok |
Detaylı Framework Seçim Rehberi
LangGraph — Production multi-agent için 2026'nın referansı. Stateful graph mimarisi, supervisor pattern'ı native destekler, observability (LangSmith) entegre. Türk şirketlerinde en sık tercih edilen framework.
AutoGen — Microsoft Research kaynaklı. Multi-agent "conversation" paradigması güçlü; code execution native. Microsoft / Azure ekosistemindekiler için doğal seçim.
CrewAI — Hızlı prototip, rol-tabanlı thinking (researcher / writer / critic). MVP'ler ve PoC'ler için ideal; production'a ölçeklenince LangGraph'a geçiş yaygın.
Anthropic Claude Code + MCP — 2025-2026'nın yeni nesil agent geliştirme deneyimi. MCP sayesinde tool kataloğu standartlaştı; Claude'un native agent yetkinliği framework gereksinimini azalttı.
Vercel AI SDK — TypeScript / Next.js dünyasının tercihi. Streaming, tool use, agent loop'lar native. Sukruyusufkaya.com gibi Next.js tabanlı kurumsal sitelerin pratik tercihi.
7. Model Context Protocol (MCP) — 2025'in En Önemli Standardı
Bir agent kuran her ekip aynı problemi yaşıyordu: her bir tool entegrasyonu (Slack, Gmail, CRM, dosya sistemi) ayrı bir kod yazımı gerektiriyordu. Anthropic'in Kasım 2024'te tanıttığı MCP bu sorunu standartlaştırdı.
- MCP (Model Context Protocol)
- AI modellerinin harici veri kaynaklarına ve araçlara güvenli, standart bir şekilde bağlanması için Anthropic tarafından tanıtılan açık protokol. Tool sağlayıcıları MCP sunucusu yayınlar; agent geliştiricileri MCP istemcisi olan herhangi bir model ile bağlanır. USB-C'nin donanım için yaptığını AI tool entegrasyonu için yapar.
- Ayrıca: Model Context Protocol, AI Tool Standardı
MCP'nin Yapısı
- MCP Server: Bir tool / veri kaynağı yayınlar (örn. Slack MCP, Postgres MCP, Filesystem MCP)
- MCP Client: Agent kullanan uygulama (Claude Code, Claude Desktop, Cursor, vb.)
- Transport: Stdio, HTTP-SSE veya WebSocket üzerinden JSON-RPC
2026 İtibarıyla MCP Ekosistemi
- 150+ topluluk MCP sunucusu — Slack, GitHub, Linear, Notion, Postgres, Google Drive, Jira, Salesforce
- Resmi adopsiyon — OpenAI (Mart 2025), Microsoft Copilot Studio, Google bahar 2025
- Türkçe yerel araçlar — KVKK uyumlu MCP sunucusu örnekleri yavaş yavaş çıkmaya başladı
8. Üretim Endişeleri: Bir Agent'ı Canlıya Almak
Bir agent'ı POC'den üretime taşımak, klasik LLM uygulamalarından çok daha zordur. Beş kritik konu:
8.1. Maliyet (Token Patlaması)
Bir tek-prompt LLM çağrısı 2-5K token tüketebilirken, bir agent görevi 20-100K token tüketebilir. Multi-agent görevlerde bu 200-500K'ya çıkar. Bütçe takibi şarttır.
Pratik Maliyet Formülü
Tek bir agent görevinin tahmini token maliyeti:
Maliyet = (Adım sayısı) × (Ortalama input token × input fiyat + Ortalama output token × output fiyat) + Tool çağrı maliyetleri
Örnek hesaplama. 10 adımlık bir agent görevi, her adımda ortalama 4K input + 500 output token, Claude Opus 4.7 ($15 input / $75 output per 1M):
- Per-adım maliyet: (4000 × $15 + 500 × $75) / 1M = $0.0975
- Toplam görev: 10 × $0.0975 = $0.975 (yaklaşık 1 dolar)
- Aynı görev Claude Haiku 4.5 ile (
$1 input / $5 output): **$0.065**
10x maliyet farkı = aylık 10K görev için $9.000'a karşı $650. Model routing (basit adımlar Haiku'ya, karmaşık adımlar Opus'a) tipik olarak %60-80 toplam tasarruf sağlar.
Maliyet Optimizasyon Kontrol Listesi
- Prompt caching — tekrar eden system prompt'larda %50-90 indirim (Anthropic, OpenAI cached input fiyatlandırması)
- Model routing — adım karmaşıklığına göre dinamik LLM seçimi
- Tool sonuç caching — aynı tool'un aynı parametrelerle tekrar çağrısında cache hit
- Max-iter sınırı — agent döngüsü için katı üst sınır (örn. max 20 adım)
- Streaming + early-stop — kullanıcı tatmin olduğunda erken durdurma
- Batch API — async iş yükleri için OpenAI/Anthropic %50 indirim
8.2. Güvenilirlik (Reliability)
Agent'lar olasılıksal — aynı girdiyle farklı çıktı üretebilirler. Üretim için deterministik kısımları workflow'a, esnek kısımları agent'a ayırmak iyi pattern'dir. Critical path'leri katı şemalarla (Pydantic, Zod) sertleştirin.
8.3. Gecikme (Latency)
Çoklu adımlı görevlerde toplam yanıt süresi 30 saniyeden dakikalara kadar çıkabilir. Çözümler:
- Streaming — kullanıcıya ilerleme göstermek
- Paralel tool çağrıları — bağımsız adımları aynı anda
- Model routing — basit adımlara küçük model, karmaşık olanlara büyük
8.4. Observability
Agent görevlerinin ne yaptığını izlemek klasik logging'den çok daha karmaşıktır. 2026 araçları:
- LangSmith — LangChain ekosistem
- Langfuse — açık kaynak alternatif
- Helicone — basit, hızlı kurulum
- Arize Phoenix — gelişmiş eval entegrasyonu
- OpenLLMetry — OpenTelemetry standartı üzerine
8.5. Güvenlik ve Guardrails
Bir agent, eylem alacağı için güvenlik katmanı şarttır:
- Tool izinleri — hangi agent hangi tool'a erişebilir?
- Dry-run modu — yıkıcı eylemler (silme, ödeme) önce simüle edilir
- Human-in-the-Loop (HITL) — kritik eylemler için insan onayı
- Prompt injection savunması — kullanıcı girdisinin sistem prompt'unu manipüle etmesine karşı
- Sandbox — code execution mutlaka izole edilmiş ortamda
9. Agent Eval: Klasik LLM Eval'inden Niye Farklı?
Bir LLM cevabı tek-noktada değerlendirilebilir (faithfulness, relevance). Bir agent görevi çoklu adım, çoklu tool, çoklu olası çıktı içerir. Eval boyutları:
| Boyut | Ne Ölçer? | Kritik Soru |
|---|---|---|
| Görev Başarısı (Task Success) | Hedefe ulaşıldı mı? | Kullanıcının istediği sonuç gerçekleşti mi? |
| Plan Kalitesi | Doğru tool sırası seçildi mi? | Verimsiz adımlar var mı? |
| Tool Kullanım Doğruluğu | Argümanlar doğru mu, çağrılar valid mi? | Tool şemasına uygun mu? |
| Adım Verimliliği | Kaç adımda çözüldü? | Optimal adım sayısına yakın mı? |
| Maliyet | Token + tool çağrısı maliyeti | Bütçe içinde mi? |
| Gecikme | Toplam görev süresi | Hedef p50/p95 içinde mi? |
| Güvenlik | Yıkıcı/yanlış eylem var mı? | HITL gerekli yerleri tanıdı mı? |
Eval altyapısı: LangSmith, Langfuse, Patronus, Braintrust, DeepEval Agent module. Manuel test setleri (50-200 görev) + otomatik LLM-as-judge + insan değerlendirmesi kombinasyonu pratik standarttır.
10. KVKK + EU AI Act Çerçevesinde Agent'lar
Otonom karar veren bir AI sistemi, regülatif çerçevelerde özellikle hassas kategoridedir.
KVKK Açısından
- Kişisel veri otomasyonu. Bir agent müşteri verisini birden çok sistemde işliyorsa, KVKK aydınlatma metni bu otomasyonu içermelidir.
- Otomatik karar verme. Tamamen otomatik karar veren agent'lar (örn. kredi onayı), KVKK Madde 11 — Otomatik İşleme'ye Karşı İtiraz hakkı kapsamına girer.
- Audit log zorunluluğu. Her agent eyleminin denetlenebilir kayıt altına alınması gerekir.
EU AI Act Açısından
- Yüksek risk sınıflandırması. İK seçimi, kredi skorlama, eğitim değerlendirme gibi alanlarda agent çalıştırmak otomatik yüksek-risk kategorisidir.
- İnsan denetimi (Madde 14). Yüksek risk agent'ların kritik kararlarda insan onayı süreci gerekir.
- Şeffaflık. Kullanıcının bir agent ile etkileşimde olduğunu bilmesi şarttır.
11. Türk Şirketleri için Agent Use-Case'leri
11.1. Müşteri Hizmetleri Agent
Sadece sohbet eden değil, ticket açan, sipariş durumu sorgulayan, iade başlatan, müşteriye sözleşme gönderen agent. Türk telekom ve e-ticaret şirketlerinde 2025-2026 aktif yatırım alanı.
11.2. İç Operasyon Agent
İK onay süreçleri, finans rapor oluşturma, IT ticket triage, satınalma talebi başlatma. Tipik olarak Slack/Teams entegrasyonlu, MCP üzerinden iç sistemlere bağlanır.
11.3. Sales / SDR Agent
Lead araştırma, kişiselleştirilmiş outreach, takip e-postaları, CRM kayıt güncelleme. AI Otomasyon Ajansı (AAA) iş modelinin temeli.
11.4. Research Agent
Pazar araştırması, rakip analizi, akademik literatür taraması, yatırım due diligence. Stratejik karar destek aracı olarak yöneticilere büyük zaman kazandırır.
11.5. Code Agent (Developer Asistanı)
Cursor Agent, Claude Code, Devin, GitHub Copilot Workspace gibi ürünler. Pull request açabilen, test yazabilen, refactor yapabilen ajan geliştiriciler. Yazılım ekiplerinin verimliliğini %30-50 artırdığı raporlanıyor.
11.6. Hukuki Asistan Agent
Sözleşme analizi, mevzuat değişiklik takibi, dava emsali tarama. Hukuk büroları için RAG + agent hibrit mimarisi.
11.7. Operasyonel İzleme Agent
Sistemin alarm verdiğinde otonom triage yapan, log analiz eden, ilk yanıt aksiyonları (rollback, restart) öneren ya da otomatik yapan DevOps/SRE agent'ı.
12. Vaka Çalışmaları (Anonim Türk Şirketleri)
Vaka 1 — Türk Bankası: İç Bilgi Agent'ı
Problem. Banka çalışanları (özellikle çağrı merkezi temsilcileri ve şube personeli) ürün soruları, mevzuat değişiklikleri ve operasyonel prosedürler için sürekli iç bilgi tabanını araştırıyordu. RAG sistemi vardı ama her soru için manuel sorgu gerekiyordu.
Çözüm. LangGraph supervisor + 3 sub-agent (Ürün, Mevzuat, Operasyon). Slack/Teams native entegrasyon. MCP üzerinden iç wiki, ürün kataloğu, mevzuat repo'sundan otomatik bilgi getirme. Çalışan "kart komisyon değişikliği var mı?" gibi doğal dilde soruyor, ajan ilgili sub-agent'a yönlendiriyor, doğru cevap + kaynak gösterimi ile dönüyor.
Sonuç. Çalışan başına haftalık 3.2 saatten 1.1 saate düşen bilgi arama süresi. Çalışan memnuniyeti skoru +18 puan. ROI: 9 ayda yatırımın 4 katı geri ödendi.
Vaka 2 — Hukuk Bürosu: Sözleşme Analiz Agent'ı
Problem. Sözleşme analizi yapan avukatlar her belgeyi manuel okuyup risk maddelerini, eksik şartları ve emsal davaları araştırıyordu. Standart bir sözleşme analizi 4-6 saat sürüyordu.
Çözüm. CrewAI + 4 rol-tabanlı agent: Okuyucu (yapı-tabanlı chunking ile madde madde analiz), Risk Analisti (risk skorlama), Mevzuat (KVKK, TBK, TMK karşılaştırma — RAG ile), Yazar (final özet rapor). Claude Opus 4.7 (1M context, uzun sözleşmeler için ideal) tabanlı.
Sonuç. Sözleşme analiz süresi 4-6 saatten 35 dakikaya. Avukatlar kaynak gösterimli rapor alıyor; final karar her zaman avukat onayında. Bürodaki ortalama dava süresi %22 kısaldı; yıllık $480K ek gelir.
Vaka 3 — E-Ticaret Pazaryeri: Tedarikçi Sales Agent'ı
Problem. Pazaryerine yeni satıcı kazandırma sürecinde her potansiyel tedarikçiye özelleştirilmiş bir teklif paketi hazırlamak günler alıyordu — pazar araştırması, ürün uygunluk analizi, fiyat teklifi, sözleşme taslağı.
Çözüm. OpenAI Operator-tabanlı agent + computer use yetkinliği. Agent CRM'i tarıyor, LinkedIn'den şirket bilgisi topluyor, ürün kataloğunu inceliyor, kişiselleştirilmiş teklif paketi oluşturuyor, sales temsilcisinin onayına sunuyor.
Sonuç. Yeni satıcı onboarding süresi 5 günden 1.5 güne. Onboard edilen aylık satıcı sayısı 2.4x. ROI: 6 ayda 7x.
13. Agent Geliştirme Yol Haritası
Sıfırdan Üretime: Agent Geliştirme Yol Haritası
Bir Türk şirketinin sıfırdan üretim kalitesinde agent kurma süreci.
- 1
Hafta 1-2: Use-Case Validation
Hangi sürece agent eklemek değer? Mevcut çözümün maliyeti ne? Beklenen ROI nedir? Tek-agent vs multi-agent uygunluğu?
- 2
Hafta 3-4: Tool Envanteri ve MCP Stratejisi
Hangi sistemlere entegre olunacak (CRM, ERP, ticket, dosya, mail)? MCP sunucusu var mı, yoksa custom mu yazılacak? KVKK risk değerlendirmesi.
- 3
Hafta 4-8: MVP Build
Tek-agent ReAct ile MVP. LangGraph veya Vercel AI SDK seçimi. Claude Opus 4.7 veya GPT-5 default LLM. Temel tool seti (5-10 tool).
- 4
Hafta 8-10: Eval Harness
50-100 görevlik test seti. Task success rate, plan quality, cost-per-task, latency p50/p95 metrikleri. Langfuse veya LangSmith kurulumu.
- 5
Hafta 10-14: Guardrails ve HITL
Yıkıcı eylem listesi, izin matrisi, HITL onay akışı, audit log, observability dashboard.
- 6
Hafta 14-18: Production Hardening
Streaming, paralel tool çağrıları, rollback prosedürleri, prompt injection testleri.
- 7
Hafta 18-22: Pilot Production
Sınırlı kullanıcı grubu, günlük metrik takibi, hızlı iterasyon.
- 8
Hafta 22-26: Tam Üretim
Tüm kullanıcılara açılma, multi-agent geliştirmeye geçiş (gerekliyse), KVKK uyumu ve dokümantasyon final.
14. Yaygın Hata Patternleri ve Anti-Pattern'ler
Üretim agent projelerinde tekrar tekrar karşılaşılan hatalar:
14.1. "Tek Mega-Agent" Tuzağı
Tek bir agent'a 30+ tool veriliyor, "her şeyi yapsın" deniyor. Sonuç: planner bunalıyor, yanlış tool seçimleri çoğalıyor, eval imkânsızlaşıyor. Çözüm: Görev kapsamını daraltın veya supervisor + uzman sub-agent'lara bölün.
14.2. Eval Olmadan Üretim
"Beta'da test ediyoruz" diyerek eval harness'i atlamak. İlk gerçek hata kullanıcı raporu olduğunda iş işten geçer. Çözüm: Üretim öncesi 50+ task'lık eval set zorunlu; CI'de her PR ile koşulmalı.
14.3. HITL Yokluğu
Tüm kararları otonom yapan agent — kritik eylemlerde insan onayı atlanmış. KVKK + EU AI Act riski. Çözüm: Yıkıcı, mali veya kullanıcı-etkisi yüksek eylemlerde HITL şart.
14.4. Sonsuz Döngüler
Refleksiyon döngüsünde agent kendi cevabını sürekli yeniden değerlendiriyor. Token bombası. Çözüm: Katı max-iter (örn. 20), max-cost ($0.50/task) ve max-time (5 dk) sınırları.
14.5. Prompt Injection'a Açık Tool Use
Kullanıcı girdisi sistem prompt'unu manipüle ediyor; agent yetkisiz tool çağırıyor. Çözüm: Strict input validation, tool kullanım yetkilendirme, sandboxed kod yürütme.
14.6. Observability Olmadan Üretim
"Niye bu agent şöyle yaptı?" sorusuna cevap veremeyiş. Çözüm: Langfuse / LangSmith / Helicone day-1 kurulumu; her tool call, planner kararı, eval skoru saklanmalı.
14.7. "Şeffaflık Yok" Pattern'i
Kullanıcının bir agent'la konuştuğunu bilmemesi — EU AI Act şeffaflık yükümlülüğü ihlali. Çözüm: Net AI bildirimi, agent eylem özetleri, kullanıcıya kontrol mekanizmaları.
14.8. Maliyet Sürprizi
Token bütçesi olmadan production'a çıkmak; ay sonu fatura beklenenden 10x. Çözüm: Per-user, per-task, per-day budget caps + uyarı eşikleri.
15. 2026-2030 Agent Geleceği
1. MCP standardı yaygınlaşıyor. Tüm SaaS ürünlerinin MCP sunucusu yayınlaması 2027'de mecburi konuma geliyor; AI motorları, agent-uyumlu olmayan ürünleri ekosistemde dezavantajlı kılıyor.
2. Computer use mainstream'e geçiyor. Anthropic Computer Use ve OpenAI Operator'ın 2026 olgunlaşmasıyla, RPA pazarı kökten dönüşüyor. UI-Path, Automation Anywhere gibi klasik RPA şirketleri AI-native ürünler tarafından sıkıştırılıyor.
3. Multi-agent A2A standartlaşıyor. Google'ın A2A protokolü ve benzer girişimler, agent'ları bağımsız servisler arası iletişim kurabilir hale getirecek.
4. Specialized vertical agents. Hukuk, sağlık, finans, perakende için özel-eğitimli agent platformları çıkıyor. "Tek bir genel agent" yerine "her sektör için özel agent" trendi güçleniyor.
5. Agent eval framework'leri olgunlaşıyor. 2026 sonunda "agent benchmark" alanı bugünkü "LLM benchmark" alanı kadar olgun olacak.
6. Self-improving agents (sınırlı). Reflection + memory + fine-tuning loop'larla kendini iyileştiren agent'lar araştırma aşamasında; production'a 2027-2028.
7. Regülatif sıkışma. EU AI Act'ın 2026-2027 implementasyonu, otonom karar veren agent'lar için somut yükümlülükler getirir; ABD eyaletleri ve Türkiye benzer yasalar tartışıyor.
16. Sıkça Sorulan Sorular
17. Bir Sonraki Adım
Şirketinizde agent stratejisi belirlemek veya mevcut bir agent uygulamayı üretim kalitesine taşımak için üç hizmet:
- Agent mimari atölyesi. Use-case değerlendirme, tek-vs-multi karar, framework seçimi, tool envanteri, KVKK risk haritası — 4 saatlik oturumda netleşir.
- Agent eval harness kurulumu. 50-200 görevlik test seti, observability stack, monitoring dashboard. Mevcut agent'ı kalite ölçeğine taşır.
- Production audit. Canlı bir agent'ınız varsa maliyet, gecikme, hata, güvenlik, uyum açısından 360 derece denetim ve iyileştirme yol haritası.
İletişim için site üzerindeki contact formunu kullanabilirsiniz.
Kaynaklar
- Building Effective Agents — Anthropic, Anthropic ·
- ReAct: Synergizing Reasoning and Acting in Language Models — Yao et al., ICLR 2023 ·
- Reflexion: Language Agents with Verbal Reinforcement Learning — Shinn et al., NeurIPS 2023 ·
- Toolformer: Language Models Can Teach Themselves to Use Tools — Schick et al., NeurIPS 2023 ·
- Tree of Thoughts: Deliberate Problem Solving — Yao et al., NeurIPS 2023 ·
- Model Context Protocol Specification — Anthropic, Anthropic ·
- LangGraph Documentation — LangChain, LangChain ·
- AutoGen: Enabling Next-Gen LLM Applications — Microsoft Research, Microsoft ·
- CrewAI Documentation — CrewAI Inc., CrewAI ·
- OpenAI Operator — OpenAI, OpenAI ·
- Anthropic Computer Use — Anthropic, Anthropic ·
- Vercel AI SDK — Vercel, Vercel ·
- EU Artificial Intelligence Act — European Commission, EU ·
- KVKK - 6698 Sayılı Kanun — T.C. KVKK, Türkiye Cumhuriyeti ·
Bu rehber yaşayan bir belgedir; AI Agent ekosistemi (framework'ler, MCP standartları, computer use yetkinlikleri) her çeyrek hızla değiştiği için çeyreklik olarak güncellenmektedir.
Danismanlik Baglantilari
Bu yazıya en yakın consulting sayfaları
Bu içerikten sonraki mantıklı adım için en ilgili solution, role ve industry landing'lerini burada görebilirsin.
AI Agent ve Workflow Otomasyonu
Tek adimli chatbot'larin otesine gecen; arac, kural ve insan onayi ile ilerleyen AI destekli is akislarina gecis.
AI Evaluation, Guardrails ve Observability
Yapay zeka sistemlerinin dogruluk, guvenlik ve performansini olcmek, izlemek ve kontrollu hale getirmek icin kapsamli degerlendirme katmani.
Musteri Hizmetleri Ekipleri icin Bilgi Tabanli AI Asistanlari
Temsilcilere anlik bilgi, cevap onerisi ve surec yonlendirmesi saglayarak hizmet kalitesini ve yanit hizini artiran AI destek sistemleri.