İçeriğe geç
Yapay Zeka·32 dk·12 Mayıs 2026·13

AI Agent Nedir? Otonom Yapay Zeka Mimarileri 2026 — Uçtan Uca Kapsamlı Rehber

AI Agent'ların 2026'da nasıl çalıştığını, hangi mimarilerin neyi çözdüğünü, Türk şirketleri için ne anlama geldiğini uçtan uca açıklayan ultra kapsamlı bir referans. ReAct, multi-agent, MCP, tool use, computer use, browser agent'lar, LangGraph / AutoGen / CrewAI / Claude Code framework'leri, üretim endişeleri, eval, güvenlik, KVKK uyumu ve 3 anonim Türk şirketi vaka çalışması.

SYK
Şükrü Yusuf KAYA
AI Expert · Kurumsal AI Danışmanı
Özet (TL;DR)

Tek cümlelik cevap: AI Agent, LLM’in cevap verme yeteneğine plan yapma ve araç kullanma katmanlarını ekleyen — birden çok adımda otonom iş yürütebilen — yeni nesil yapay zeka sistem mimarisidir.

  • AI Agent, bir hedefe ulaşmak için ortamı algılayan, plan yapan, araç kullanan ve eylem alan otonom AI sistemidir — geleneksel LLM cevap üretmekle kalır, agent eylem alır.
  • Bir agent dört bileşenden oluşur: LLM beyni, hafıza (kısa+uzun), planner ve tool/executor. Bu dördünün döngülü işlemesi otonomluk üretir.
  • 2026 ekosistemi: tek-agent (ReAct), supervisor (LangGraph), multi-agent collaboration (AutoGen/CrewAI), browser & computer use (Operator, Claude Computer Use). MCP standartlaşan tool entegrasyonu protokolü.
  • Agent'lar token maliyetini 10-100x artırabilir; üretim için eval, observability, guardrails ve insan-onay (HITL) süreçleri olmadan ölçeklenemezler.
  • KVKK ve EU AI Act kapsamında otonom karar veren agent'lar yüksek risk kategorisinde değerlendirilir; insan denetimi, audit log ve kayıt tutma zorunludur.

1. AI Agent Nedir? — Tek Cümlelik Cevap ve Uzun Tanım

LLM ile AI Agent arasındaki temel fark, basit bir cümleyle özetlenebilir: LLM cevap üretir; Agent eylem alır. Bir LLM ChatGPT pencerenizde size cevap verirken, bir Agent aynı sorguyla bir araştırma yapar, e-posta gönderir, dosya düzenler, CRM'de kayıt açar — ve bunu tek seferde değil çoklu-adımlı bir plan üzerinden gerçekleştirir.

Tanım
AI Agent
Belirli bir hedefi gerçekleştirmek için ortamı algılayan, plan yapan, araç (tool) kullanan ve eylemler alan otonom AI sistemi. Tipik mimarisi: hedef + LLM beyni + araç kataloğu + hafıza + döngüsel karar verme. Reaktif değil proaktif; tek-adımlı değil çok-adımlı; deterministik değil hedef-yönelimli.
Ayrıca: Agentic AI, Autonomous AI, LLM Agent

Bu fark bilim kurgu değildir; 2024-2026 döneminde production'da gözlenen somut bir paradigma kaymasıdır. Claude Code, GitHub Copilot Workspace, Cursor Agent, Replit Agent, Devin, OpenAI Operator, Anthropic Computer Use, Microsoft Copilot Studio — hepsi bu paradigmanın somut ürünleri.

Geleneksel LLM Çağrısı vs Agent

Geleneksel kullanım: "Bu PDF'i özetle" → tek bir prompt, tek bir cevap. Agent kullanımı: "Müşterinin son 6 aylık siparişlerini analiz et, en sık aldığı ürün kategorisinin geçen ay stoğu yetersizse satın alma talebi oluştur" → ajan veritabanını sorgular, tabloları analiz eder, stok sistemini kontrol eder, satın alma talebi açar, e-posta gönderir.

2. AI Agent'ın Anatomisi: Dört Çekirdek Bileşen

Bir AI Agent'ı oluşturan dört temel bileşen vardır. Bu dördünü ayrı ayrı tasarlamadan dayanıklı bir agent kurmak mümkün değildir.

2.1. LLM Beyni

Agent'ın akıl yürüten ve karar veren çekirdek motoru. 2026 itibarıyla bayrak agent modelleri:

  • Claude Opus 4.7 — uzun bağlam (1M), tool use, agent kullanımında lider; Anthropic'in agent-centric eğitim odağı
  • GPT-5 — function calling, multi-step reasoning, OpenAI Operator entegrasyonu
  • Gemini 3 Pro — multimodal agent görevleri, Google Workspace entegrasyonu
  • Açık alternatif — Llama 4 70B, DeepSeek V3, Qwen 2.5 (tool use destekli)

2.2. Hafıza (Memory)

Bir agent'ın "geçmişi hatırlaması" iki katmanda gerçekleşir:

  • Kısa süreli hafıza (short-term): Aktif görev boyunca context window içinde tutulan konuşma geçmişi, ara çıktılar, plan durumu.
  • Uzun süreli hafıza (long-term): Vektör DB üzerinde tutulan geçmiş etkileşimler, kullanıcı tercihleri, organizasyonel bilgi. Genelde RAG mimarisi ile entegre edilir.
Tanım
Agent Memory
Bir AI agent'ın görevler arası ve görev içi bilgi tutma katmanı. Kısa süreli hafıza context window'da yaşar; uzun süreli hafıza vektör DB veya yapılandırılmış veritabanında saklanır. Epizodik (yaşanan olaylar), semantik (öğrenilen bilgiler) ve prosedürel (öğrenilen iş akışları) alt-türleri olabilir.

Üç Memory Türü ve Pratik Uygulama

  • Epizodik hafıza: "Geçen hafta müşteri X ile şu sohbeti yapmıştık" tarzı zaman-bağlamlı olaylar. Vektör DB + timestamp metadata tipik mimari.
  • Semantik hafıza: "Müşterinin tercih ettiği iletişim kanalı e-posta" tarzı çıkarsanmış kararlı bilgiler. Genelde structured DB (Postgres, MongoDB) içinde.
  • Prosedürel hafıza: "Bu sektörde fatura itirazı yanıtı şu adımlardan oluşur" tarzı öğrenilmiş iş akışları. Tipik olarak prompt şablonu + örnek-bazlı few-shot referansları.

Memory Framework'leri

  • Mem0 — açık kaynak, otomatik fact extraction + retrieval
  • Zep — kullanıcı bazlı uzun-süreli memory + temporal graph
  • LangMem — LangChain memory yönetimi (semantic + episodic karışımı)
  • Letta (eski MemGPT) — virtual context (uzun-bağlam simülasyonu)

2.3. Planner

Agent'a "şimdi ne yapacağım?" sorusunu cevaplatan bileşen. Pratikte üç ana strateji kullanılır:

  • Chain-of-Thought (CoT): "Adım adım düşün" prompt'u ile model kendi muhakemesini açıklar.
  • ReAct (Reason + Act): Düşünce → Eylem → Gözlem → Düşünce döngüsü. Modern agent'ların en yaygın temel deseni.
  • Tree-of-Thoughts (ToT): Birden çok plan dalı oluştur, en iyiyi seç. Karmaşık problem çözümünde kalite artırır ama maliyet 3-10x.
  • Plan-and-Solve: Önce tüm planı çıkar (planning), sonra adım adım uygula (solving). Plan ve yürütme ayrımı eval'i kolaylaştırır; planı insan onayına sunmak için ideal.
  • ReWOO (Reasoning WithOut Observation): Tool çıktısını beklemeden planı çoklu adım olarak kuran, sonra paralel yürüten yaklaşım. Bağımsız adımlar paralelleşince gecikme %40-60 azalır.
  • Self-Discover: Modelin verili problem için kendi muhakeme yapısını keşfetmesini sağlayan yöntem (Google DeepMind, 2024). Karmaşık problemlerde +%10-25 kalite kazanımı raporlandı.
  • Reflexion: Hata yapan agent'ın kendi hatasını analiz edip bir sonraki denemede düzeltmesi. Test/kod-yazma görevlerinde tek adım iyileştirme % 20+ olabilir; ama döngüye girme riski için max-iter sınırı şart.
  • Graph-of-Thoughts (GoT): ToT'nin genelleştirilmiş hâli — fikirler arasında geri besleme bağlantıları. Akademik araştırma aşamasında, production'a tipik olarak gerek yok.

2.4. Tool / Executor

Agent'ın dış dünyaya etki ettiği katman. Tool kataloğu tipik olarak şunları içerir:

  • API çağrıları — CRM, ERP, ticket sistemi, hesaplama servisleri
  • Veritabanı sorguları — SQL, vektör arama
  • Dosya sistemi işlemleri — okuma, yazma, dönüştürme
  • Web — tarayıcı, arama API'leri
  • Kod yürütme — Python sandbox, JavaScript runtime
  • İletişim — e-posta gönderme, Slack mesajı, Teams notification
  • MCP sunucuları — standartlaştırılmış üçüncü taraf tool entegrasyonu

3. Agent Karar Döngüsü: Bir Görev Nasıl Yürütülür?

Bir agent görevini şu döngüde tamamlar:

Nasıl Yapılır

Tipik AI Agent Karar Döngüsü

Bir agent'ın hedeften tamamlamaya kadar adımları.

Toplam süre:
  1. 1

    1. Hedef Yorumlama

    Kullanıcının doğal dil talebi anlaşılabilir alt-hedefler olarak parçalanır.

  2. 2

    2. Plan Oluşturma

    LLM bir plan yapar: hangi araçları, hangi sırayla, hangi parametrelerle çağıracak?

  3. 3

    3. Tool Seçimi

    Plana göre ilk eylem için uygun tool seçilir; argümanlar yapılandırılır.

  4. 4

    4. Yürütme

    Tool çağrılır; sonuç (output, hata, exception) ele alınır.

  5. 5

    5. Gözlem ve Refleksiyon

    Sonuç değerlendirilir: hedefe yaklaştık mı, plan değişmeli mi?

  6. 6

    6. Plan Güncelleme veya Sonlandırma

    Hedef tamamlandıysa cevap üretilir; aksi halde döngüye geri dönülür.

  7. 7

    7. Hafıza Yazımı

    Görev sonunda epizodik hafızaya kayıt yapılır; gelecek görevler için bağlam korunur.

Bu döngünün bir iterasyonu tek bir LLM çağrısı değildir — tipik bir agent görevi 5-50 LLM çağrısı arasında değişebilir. Maliyet ve gecikme yönetimi bu yüzden kritiktir.

4. Agent Mimari Kalıpları (5 Pattern)

Tek bir doğru agent mimarisi yoktur; problem yapısına göre tercih edilen 5 ana pattern bulunur.

4.1. Tek Agent (Single Agent)

En basit form. Bir LLM, bir tool kataloğu, ReAct döngüsü. Müşteri hizmetleri chatbot'u, iç verimlilik aracı, kişisel asistan gibi sınırlı kapsamlı görevler için ideal.

Tek Agent Mimarisi — Ne Zaman Tercih Edilir?
BoyutTek AgentMulti-Agent
KarmaşıklıkTek-domain görevlerÇoklu uzmanlık alanı
MaliyetDüşükYüksek (token çoğalır)
EvalGörece kolayÇok zor
DebugDoğrudanİletişim izleme gerekir
Hata payıDüşükYüksek (kaskat hatalar)

4.2. Supervisor (Orkestrasyon)

Bir "yönetici" agent (supervisor), alt görevleri uzmanlaşmış sub-agent'lara delege eder ve sonuçları birleştirir. Bu pattern, LangGraph'ın bayrak kalıbıdır ve 2025-2026 üretim sistemlerinin en yaygın multi-agent yapısıdır.

Tipik yapı:

  • Supervisor: hedefi anlayıp uygun sub-agent'ı seçer
  • Researcher: web/RAG ile bilgi toplar
  • Analyzer: veri analizi yapar
  • Writer: rapor/cevap yazar
  • Critic: çıktıyı değerlendirir

4.3. Hierarchical (Hiyerarşik)

Supervisor'ın supervisor'u olan, ağaç yapılı agent organizasyonu. Çok karmaşık projeler (örn. otonom yazılım geliştirme — Devin) bu yapıyı kullanır.

4.4. Swarm (Sürü)

Eş-düzey ajanların paralel çalışıp birbirlerinin çıktısını referans alması. OpenAI'ın "Swarm" framework'ü ve CrewAI'ın "process" modu bu yaklaşımı destekler.

4.5. Network (A2A — Agent-to-Agent)

Agent'lar bağımsız servisler olarak ağ üzerinden iletişim kurar. 2025 sonu / 2026 başında A2A protokolü standartlaşma çalışmaları başladı (Google'ın A2A inisiyatifi). Henüz erken aşama ama bir sonraki büyük adım.

4.6. Agent vs Workflow vs RAG vs Fine-tuning — Karar Matrisi

Her problem agent ile çözülmez. Aşağıdaki matris, doğru aracı seçmenize yardımcı olur.

Hangi Yaklaşım, Hangi Problem İçin?
İhtiyaçWorkflowRAGAgentFine-tuning
Deterministik çoklu adım✓ İdeal---
Güncel bilgiye erişim-✓ İdealKısmi-
Belgeden cevap üretme-✓ İdeal--
Dinamik karar verme--✓ İdeal-
Çoklu tool kullanımıSınırlı-✓ İdeal-
Stil/format kilitleme---✓ İdeal
Düşük maliyetMaliyetliTek seferlik
Debug kolaylığıYüksekOrtaDüşükDüşük
Üretime hızHaftaHafta-ayAy-çeyrekÇeyrek

Hibrit Yaklaşım — Yaygın Üretim Mimarisi:

Çoğu olgun üretim sistemi dördünü birlikte kullanır:

  • Workflow: deterministik ana akışı yönetir (örn. sipariş işleme adımları)
  • RAG: bilgi sorularına cevap verir (örn. ürün katalog, mevzuat)
  • Agent: dinamik karar gerektiren noktalar (örn. müşteri itirazı triage)
  • Fine-tuning: marka tonu ve format şablonu

5. Çekirdek Yetkinlikler: Bir Agent Neler Yapabilir?

Modern agent'ların pratik yetenekleri beş ana kategoriye ayrılır.

5.1. Tool Use / Function Calling

Agent'ın yapılandırılmış API çağrıları yapması. OpenAI Function Calling (Aralık 2023), Anthropic Tool Use (Mart 2024), Gemini Function Calling — hepsi aynı amaca hizmet eder: LLM'in JSON formatında parametreli fonksiyon çağrısı üretmesi.

5.2. Code Execution

Agent'ın güvenli bir sandbox'ta Python (en yaygın) çalıştırması. ChatGPT Code Interpreter / Advanced Data Analysis, Claude'un "execute code" toolu, Replit Agent gibi sistemler bu yetkinliği kullanır. Veri analizi, hesaplama, dönüştürme görevlerinde gücün ana kaynağı.

5.3. Web Browsing

Agent'ın gerçek web tarayıcısını veya arama API'sini kullanarak güncel bilgi toplaması. OpenAI'ın "Browse" özelliği, Anthropic Claude'un Web Search'ü, Gemini Deep Research bu kategoride. Knowledge cutoff sorununu çözer.

5.4. Computer Use

Agent'ın bir bilgisayarın ekranını "görerek" fare ve klavye eylemleriyle uygulamaları kullanması. Anthropic Claude Computer Use (Ekim 2024) ile mainstream'e girdi; OpenAI Operator (Ocak 2025) rakip ürünü. Otonom süreç otomasyonunun yeni nesli.

5.5. Multi-Modal Algılama

Görüntü, ses, video anlama yetkinliği agent'ın "duyularını" genişletir. Bir agent ekran görüntüsündeki hata mesajını okuyabilir, müşteri sesini transkripte çevirebilir, video sunumun anahtar dakikalarını çıkarabilir.

6. Popüler Agent Framework'leri

Hangi framework'ü seçeceğiniz, agent'ınızın karmaşıklığı, üretim hedefiniz ve ekibinizin yetkinliklerine bağlıdır.

2026 Agent Framework Karşılaştırması
FrameworkSağlayıcıGüçlü TarafıÜretim OlgunluğuTürkçe Doküman
LangGraphLangChainStateful, supervisor pattern, çıktı kontrolüYüksekSınırlı
AutoGenMicrosoftMulti-agent conversation, code executionYüksekSınırlı
CrewAICrewAI Inc.Hızlı prototip, rol-tabanlı agentOrta-yüksekSınırlı
OpenAI Agents SDKOpenAIOperator, native function calling, Assistants v2YüksekSınırlı
Anthropic + Claude CodeAnthropicComputer use, kod yazma, MCP nativeYüksekSınırlı
Vercel AI SDKVercelJS/TS, streaming, Next.js nativeYüksekVar
SmolagentsHugging FaceHafif, açık kaynakOrtaYok
Agency SwarmToplulukOpenAI Swarm üzerine inşaOrtaYok
Semantic KernelMicrosoftPlugin-based, .NET/PythonOrtaSınırlı
PydanticAIPydanticType-safe, schema-firstOrtaYok

Detaylı Framework Seçim Rehberi

LangGraph — Production multi-agent için 2026'nın referansı. Stateful graph mimarisi, supervisor pattern'ı native destekler, observability (LangSmith) entegre. Türk şirketlerinde en sık tercih edilen framework.

AutoGen — Microsoft Research kaynaklı. Multi-agent "conversation" paradigması güçlü; code execution native. Microsoft / Azure ekosistemindekiler için doğal seçim.

CrewAI — Hızlı prototip, rol-tabanlı thinking (researcher / writer / critic). MVP'ler ve PoC'ler için ideal; production'a ölçeklenince LangGraph'a geçiş yaygın.

Anthropic Claude Code + MCP — 2025-2026'nın yeni nesil agent geliştirme deneyimi. MCP sayesinde tool kataloğu standartlaştı; Claude'un native agent yetkinliği framework gereksinimini azalttı.

Vercel AI SDK — TypeScript / Next.js dünyasının tercihi. Streaming, tool use, agent loop'lar native. Sukruyusufkaya.com gibi Next.js tabanlı kurumsal sitelerin pratik tercihi.

7. Model Context Protocol (MCP) — 2025'in En Önemli Standardı

Bir agent kuran her ekip aynı problemi yaşıyordu: her bir tool entegrasyonu (Slack, Gmail, CRM, dosya sistemi) ayrı bir kod yazımı gerektiriyordu. Anthropic'in Kasım 2024'te tanıttığı MCP bu sorunu standartlaştırdı.

Tanım
MCP (Model Context Protocol)
AI modellerinin harici veri kaynaklarına ve araçlara güvenli, standart bir şekilde bağlanması için Anthropic tarafından tanıtılan açık protokol. Tool sağlayıcıları MCP sunucusu yayınlar; agent geliştiricileri MCP istemcisi olan herhangi bir model ile bağlanır. USB-C'nin donanım için yaptığını AI tool entegrasyonu için yapar.
Ayrıca: Model Context Protocol, AI Tool Standardı

MCP'nin Yapısı

  • MCP Server: Bir tool / veri kaynağı yayınlar (örn. Slack MCP, Postgres MCP, Filesystem MCP)
  • MCP Client: Agent kullanan uygulama (Claude Code, Claude Desktop, Cursor, vb.)
  • Transport: Stdio, HTTP-SSE veya WebSocket üzerinden JSON-RPC

2026 İtibarıyla MCP Ekosistemi

  • 150+ topluluk MCP sunucusu — Slack, GitHub, Linear, Notion, Postgres, Google Drive, Jira, Salesforce
  • Resmi adopsiyon — OpenAI (Mart 2025), Microsoft Copilot Studio, Google bahar 2025
  • Türkçe yerel araçlar — KVKK uyumlu MCP sunucusu örnekleri yavaş yavaş çıkmaya başladı

8. Üretim Endişeleri: Bir Agent'ı Canlıya Almak

Bir agent'ı POC'den üretime taşımak, klasik LLM uygulamalarından çok daha zordur. Beş kritik konu:

8.1. Maliyet (Token Patlaması)

Bir tek-prompt LLM çağrısı 2-5K token tüketebilirken, bir agent görevi 20-100K token tüketebilir. Multi-agent görevlerde bu 200-500K'ya çıkar. Bütçe takibi şarttır.

Pratik Maliyet Formülü

Tek bir agent görevinin tahmini token maliyeti:

Maliyet = (Adım sayısı) × (Ortalama input token × input fiyat + Ortalama output token × output fiyat) + Tool çağrı maliyetleri

Örnek hesaplama. 10 adımlık bir agent görevi, her adımda ortalama 4K input + 500 output token, Claude Opus 4.7 ($15 input / $75 output per 1M):

  • Per-adım maliyet: (4000 × $15 + 500 × $75) / 1M = $0.0975
  • Toplam görev: 10 × $0.0975 = $0.975 (yaklaşık 1 dolar)
  • Aynı görev Claude Haiku 4.5 ile ($1 input / $5 output): **$0.065**

10x maliyet farkı = aylık 10K görev için $9.000'a karşı $650. Model routing (basit adımlar Haiku'ya, karmaşık adımlar Opus'a) tipik olarak %60-80 toplam tasarruf sağlar.

Maliyet Optimizasyon Kontrol Listesi

  • Prompt caching — tekrar eden system prompt'larda %50-90 indirim (Anthropic, OpenAI cached input fiyatlandırması)
  • Model routing — adım karmaşıklığına göre dinamik LLM seçimi
  • Tool sonuç caching — aynı tool'un aynı parametrelerle tekrar çağrısında cache hit
  • Max-iter sınırı — agent döngüsü için katı üst sınır (örn. max 20 adım)
  • Streaming + early-stop — kullanıcı tatmin olduğunda erken durdurma
  • Batch API — async iş yükleri için OpenAI/Anthropic %50 indirim

8.2. Güvenilirlik (Reliability)

Agent'lar olasılıksal — aynı girdiyle farklı çıktı üretebilirler. Üretim için deterministik kısımları workflow'a, esnek kısımları agent'a ayırmak iyi pattern'dir. Critical path'leri katı şemalarla (Pydantic, Zod) sertleştirin.

8.3. Gecikme (Latency)

Çoklu adımlı görevlerde toplam yanıt süresi 30 saniyeden dakikalara kadar çıkabilir. Çözümler:

  • Streaming — kullanıcıya ilerleme göstermek
  • Paralel tool çağrıları — bağımsız adımları aynı anda
  • Model routing — basit adımlara küçük model, karmaşık olanlara büyük

8.4. Observability

Agent görevlerinin ne yaptığını izlemek klasik logging'den çok daha karmaşıktır. 2026 araçları:

  • LangSmith — LangChain ekosistem
  • Langfuse — açık kaynak alternatif
  • Helicone — basit, hızlı kurulum
  • Arize Phoenix — gelişmiş eval entegrasyonu
  • OpenLLMetry — OpenTelemetry standartı üzerine

8.5. Güvenlik ve Guardrails

Bir agent, eylem alacağı için güvenlik katmanı şarttır:

  • Tool izinleri — hangi agent hangi tool'a erişebilir?
  • Dry-run modu — yıkıcı eylemler (silme, ödeme) önce simüle edilir
  • Human-in-the-Loop (HITL) — kritik eylemler için insan onayı
  • Prompt injection savunması — kullanıcı girdisinin sistem prompt'unu manipüle etmesine karşı
  • Sandbox — code execution mutlaka izole edilmiş ortamda

9. Agent Eval: Klasik LLM Eval'inden Niye Farklı?

Bir LLM cevabı tek-noktada değerlendirilebilir (faithfulness, relevance). Bir agent görevi çoklu adım, çoklu tool, çoklu olası çıktı içerir. Eval boyutları:

Agent Eval Boyutları
BoyutNe Ölçer?Kritik Soru
Görev Başarısı (Task Success)Hedefe ulaşıldı mı?Kullanıcının istediği sonuç gerçekleşti mi?
Plan KalitesiDoğru tool sırası seçildi mi?Verimsiz adımlar var mı?
Tool Kullanım DoğruluğuArgümanlar doğru mu, çağrılar valid mi?Tool şemasına uygun mu?
Adım VerimliliğiKaç adımda çözüldü?Optimal adım sayısına yakın mı?
MaliyetToken + tool çağrısı maliyetiBütçe içinde mi?
GecikmeToplam görev süresiHedef p50/p95 içinde mi?
GüvenlikYıkıcı/yanlış eylem var mı?HITL gerekli yerleri tanıdı mı?

Eval altyapısı: LangSmith, Langfuse, Patronus, Braintrust, DeepEval Agent module. Manuel test setleri (50-200 görev) + otomatik LLM-as-judge + insan değerlendirmesi kombinasyonu pratik standarttır.

10. KVKK + EU AI Act Çerçevesinde Agent'lar

Otonom karar veren bir AI sistemi, regülatif çerçevelerde özellikle hassas kategoridedir.

KVKK Açısından

  • Kişisel veri otomasyonu. Bir agent müşteri verisini birden çok sistemde işliyorsa, KVKK aydınlatma metni bu otomasyonu içermelidir.
  • Otomatik karar verme. Tamamen otomatik karar veren agent'lar (örn. kredi onayı), KVKK Madde 11 — Otomatik İşleme'ye Karşı İtiraz hakkı kapsamına girer.
  • Audit log zorunluluğu. Her agent eyleminin denetlenebilir kayıt altına alınması gerekir.

EU AI Act Açısından

  • Yüksek risk sınıflandırması. İK seçimi, kredi skorlama, eğitim değerlendirme gibi alanlarda agent çalıştırmak otomatik yüksek-risk kategorisidir.
  • İnsan denetimi (Madde 14). Yüksek risk agent'ların kritik kararlarda insan onayı süreci gerekir.
  • Şeffaflık. Kullanıcının bir agent ile etkileşimde olduğunu bilmesi şarttır.

11. Türk Şirketleri için Agent Use-Case'leri

11.1. Müşteri Hizmetleri Agent

Sadece sohbet eden değil, ticket açan, sipariş durumu sorgulayan, iade başlatan, müşteriye sözleşme gönderen agent. Türk telekom ve e-ticaret şirketlerinde 2025-2026 aktif yatırım alanı.

11.2. İç Operasyon Agent

İK onay süreçleri, finans rapor oluşturma, IT ticket triage, satınalma talebi başlatma. Tipik olarak Slack/Teams entegrasyonlu, MCP üzerinden iç sistemlere bağlanır.

11.3. Sales / SDR Agent

Lead araştırma, kişiselleştirilmiş outreach, takip e-postaları, CRM kayıt güncelleme. AI Otomasyon Ajansı (AAA) iş modelinin temeli.

11.4. Research Agent

Pazar araştırması, rakip analizi, akademik literatür taraması, yatırım due diligence. Stratejik karar destek aracı olarak yöneticilere büyük zaman kazandırır.

11.5. Code Agent (Developer Asistanı)

Cursor Agent, Claude Code, Devin, GitHub Copilot Workspace gibi ürünler. Pull request açabilen, test yazabilen, refactor yapabilen ajan geliştiriciler. Yazılım ekiplerinin verimliliğini %30-50 artırdığı raporlanıyor.

11.6. Hukuki Asistan Agent

Sözleşme analizi, mevzuat değişiklik takibi, dava emsali tarama. Hukuk büroları için RAG + agent hibrit mimarisi.

11.7. Operasyonel İzleme Agent

Sistemin alarm verdiğinde otonom triage yapan, log analiz eden, ilk yanıt aksiyonları (rollback, restart) öneren ya da otomatik yapan DevOps/SRE agent'ı.

12. Vaka Çalışmaları (Anonim Türk Şirketleri)

Vaka 1 — Türk Bankası: İç Bilgi Agent'ı

Problem. Banka çalışanları (özellikle çağrı merkezi temsilcileri ve şube personeli) ürün soruları, mevzuat değişiklikleri ve operasyonel prosedürler için sürekli iç bilgi tabanını araştırıyordu. RAG sistemi vardı ama her soru için manuel sorgu gerekiyordu.

Çözüm. LangGraph supervisor + 3 sub-agent (Ürün, Mevzuat, Operasyon). Slack/Teams native entegrasyon. MCP üzerinden iç wiki, ürün kataloğu, mevzuat repo'sundan otomatik bilgi getirme. Çalışan "kart komisyon değişikliği var mı?" gibi doğal dilde soruyor, ajan ilgili sub-agent'a yönlendiriyor, doğru cevap + kaynak gösterimi ile dönüyor.

Sonuç. Çalışan başına haftalık 3.2 saatten 1.1 saate düşen bilgi arama süresi. Çalışan memnuniyeti skoru +18 puan. ROI: 9 ayda yatırımın 4 katı geri ödendi.

Vaka 2 — Hukuk Bürosu: Sözleşme Analiz Agent'ı

Problem. Sözleşme analizi yapan avukatlar her belgeyi manuel okuyup risk maddelerini, eksik şartları ve emsal davaları araştırıyordu. Standart bir sözleşme analizi 4-6 saat sürüyordu.

Çözüm. CrewAI + 4 rol-tabanlı agent: Okuyucu (yapı-tabanlı chunking ile madde madde analiz), Risk Analisti (risk skorlama), Mevzuat (KVKK, TBK, TMK karşılaştırma — RAG ile), Yazar (final özet rapor). Claude Opus 4.7 (1M context, uzun sözleşmeler için ideal) tabanlı.

Sonuç. Sözleşme analiz süresi 4-6 saatten 35 dakikaya. Avukatlar kaynak gösterimli rapor alıyor; final karar her zaman avukat onayında. Bürodaki ortalama dava süresi %22 kısaldı; yıllık $480K ek gelir.

Vaka 3 — E-Ticaret Pazaryeri: Tedarikçi Sales Agent'ı

Problem. Pazaryerine yeni satıcı kazandırma sürecinde her potansiyel tedarikçiye özelleştirilmiş bir teklif paketi hazırlamak günler alıyordu — pazar araştırması, ürün uygunluk analizi, fiyat teklifi, sözleşme taslağı.

Çözüm. OpenAI Operator-tabanlı agent + computer use yetkinliği. Agent CRM'i tarıyor, LinkedIn'den şirket bilgisi topluyor, ürün kataloğunu inceliyor, kişiselleştirilmiş teklif paketi oluşturuyor, sales temsilcisinin onayına sunuyor.

Sonuç. Yeni satıcı onboarding süresi 5 günden 1.5 güne. Onboard edilen aylık satıcı sayısı 2.4x. ROI: 6 ayda 7x.

13. Agent Geliştirme Yol Haritası

Nasıl Yapılır

Sıfırdan Üretime: Agent Geliştirme Yol Haritası

Bir Türk şirketinin sıfırdan üretim kalitesinde agent kurma süreci.

Toplam süre:
  1. 1

    Hafta 1-2: Use-Case Validation

    Hangi sürece agent eklemek değer? Mevcut çözümün maliyeti ne? Beklenen ROI nedir? Tek-agent vs multi-agent uygunluğu?

  2. 2

    Hafta 3-4: Tool Envanteri ve MCP Stratejisi

    Hangi sistemlere entegre olunacak (CRM, ERP, ticket, dosya, mail)? MCP sunucusu var mı, yoksa custom mu yazılacak? KVKK risk değerlendirmesi.

  3. 3

    Hafta 4-8: MVP Build

    Tek-agent ReAct ile MVP. LangGraph veya Vercel AI SDK seçimi. Claude Opus 4.7 veya GPT-5 default LLM. Temel tool seti (5-10 tool).

  4. 4

    Hafta 8-10: Eval Harness

    50-100 görevlik test seti. Task success rate, plan quality, cost-per-task, latency p50/p95 metrikleri. Langfuse veya LangSmith kurulumu.

  5. 5

    Hafta 10-14: Guardrails ve HITL

    Yıkıcı eylem listesi, izin matrisi, HITL onay akışı, audit log, observability dashboard.

  6. 6

    Hafta 14-18: Production Hardening

    Streaming, paralel tool çağrıları, rollback prosedürleri, prompt injection testleri.

  7. 7

    Hafta 18-22: Pilot Production

    Sınırlı kullanıcı grubu, günlük metrik takibi, hızlı iterasyon.

  8. 8

    Hafta 22-26: Tam Üretim

    Tüm kullanıcılara açılma, multi-agent geliştirmeye geçiş (gerekliyse), KVKK uyumu ve dokümantasyon final.

14. Yaygın Hata Patternleri ve Anti-Pattern'ler

Üretim agent projelerinde tekrar tekrar karşılaşılan hatalar:

14.1. "Tek Mega-Agent" Tuzağı

Tek bir agent'a 30+ tool veriliyor, "her şeyi yapsın" deniyor. Sonuç: planner bunalıyor, yanlış tool seçimleri çoğalıyor, eval imkânsızlaşıyor. Çözüm: Görev kapsamını daraltın veya supervisor + uzman sub-agent'lara bölün.

14.2. Eval Olmadan Üretim

"Beta'da test ediyoruz" diyerek eval harness'i atlamak. İlk gerçek hata kullanıcı raporu olduğunda iş işten geçer. Çözüm: Üretim öncesi 50+ task'lık eval set zorunlu; CI'de her PR ile koşulmalı.

14.3. HITL Yokluğu

Tüm kararları otonom yapan agent — kritik eylemlerde insan onayı atlanmış. KVKK + EU AI Act riski. Çözüm: Yıkıcı, mali veya kullanıcı-etkisi yüksek eylemlerde HITL şart.

14.4. Sonsuz Döngüler

Refleksiyon döngüsünde agent kendi cevabını sürekli yeniden değerlendiriyor. Token bombası. Çözüm: Katı max-iter (örn. 20), max-cost ($0.50/task) ve max-time (5 dk) sınırları.

14.5. Prompt Injection'a Açık Tool Use

Kullanıcı girdisi sistem prompt'unu manipüle ediyor; agent yetkisiz tool çağırıyor. Çözüm: Strict input validation, tool kullanım yetkilendirme, sandboxed kod yürütme.

14.6. Observability Olmadan Üretim

"Niye bu agent şöyle yaptı?" sorusuna cevap veremeyiş. Çözüm: Langfuse / LangSmith / Helicone day-1 kurulumu; her tool call, planner kararı, eval skoru saklanmalı.

14.7. "Şeffaflık Yok" Pattern'i

Kullanıcının bir agent'la konuştuğunu bilmemesi — EU AI Act şeffaflık yükümlülüğü ihlali. Çözüm: Net AI bildirimi, agent eylem özetleri, kullanıcıya kontrol mekanizmaları.

14.8. Maliyet Sürprizi

Token bütçesi olmadan production'a çıkmak; ay sonu fatura beklenenden 10x. Çözüm: Per-user, per-task, per-day budget caps + uyarı eşikleri.

15. 2026-2030 Agent Geleceği

1. MCP standardı yaygınlaşıyor. Tüm SaaS ürünlerinin MCP sunucusu yayınlaması 2027'de mecburi konuma geliyor; AI motorları, agent-uyumlu olmayan ürünleri ekosistemde dezavantajlı kılıyor.

2. Computer use mainstream'e geçiyor. Anthropic Computer Use ve OpenAI Operator'ın 2026 olgunlaşmasıyla, RPA pazarı kökten dönüşüyor. UI-Path, Automation Anywhere gibi klasik RPA şirketleri AI-native ürünler tarafından sıkıştırılıyor.

3. Multi-agent A2A standartlaşıyor. Google'ın A2A protokolü ve benzer girişimler, agent'ları bağımsız servisler arası iletişim kurabilir hale getirecek.

4. Specialized vertical agents. Hukuk, sağlık, finans, perakende için özel-eğitimli agent platformları çıkıyor. "Tek bir genel agent" yerine "her sektör için özel agent" trendi güçleniyor.

5. Agent eval framework'leri olgunlaşıyor. 2026 sonunda "agent benchmark" alanı bugünkü "LLM benchmark" alanı kadar olgun olacak.

6. Self-improving agents (sınırlı). Reflection + memory + fine-tuning loop'larla kendini iyileştiren agent'lar araştırma aşamasında; production'a 2027-2028.

7. Regülatif sıkışma. EU AI Act'ın 2026-2027 implementasyonu, otonom karar veren agent'lar için somut yükümlülükler getirir; ABD eyaletleri ve Türkiye benzer yasalar tartışıyor.

16. Sıkça Sorulan Sorular

17. Bir Sonraki Adım

Şirketinizde agent stratejisi belirlemek veya mevcut bir agent uygulamayı üretim kalitesine taşımak için üç hizmet:

  1. Agent mimari atölyesi. Use-case değerlendirme, tek-vs-multi karar, framework seçimi, tool envanteri, KVKK risk haritası — 4 saatlik oturumda netleşir.
  2. Agent eval harness kurulumu. 50-200 görevlik test seti, observability stack, monitoring dashboard. Mevcut agent'ı kalite ölçeğine taşır.
  3. Production audit. Canlı bir agent'ınız varsa maliyet, gecikme, hata, güvenlik, uyum açısından 360 derece denetim ve iyileştirme yol haritası.

İletişim için site üzerindeki contact formunu kullanabilirsiniz.

Kaynaklar

  1. , Anthropic ·
  2. , ICLR 2023 ·
  3. , NeurIPS 2023 ·
  4. , NeurIPS 2023 ·
  5. , NeurIPS 2023 ·
  6. , Anthropic ·
  7. , LangChain ·
  8. , Microsoft ·
  9. , CrewAI ·
  10. , OpenAI ·
  11. , Anthropic ·
  12. , Vercel ·
  13. , EU ·
  14. , Türkiye Cumhuriyeti ·

Bu rehber yaşayan bir belgedir; AI Agent ekosistemi (framework'ler, MCP standartları, computer use yetkinlikleri) her çeyrek hızla değiştiği için çeyreklik olarak güncellenmektedir.

Danismanlik Baglantilari

Bu yazıya en yakın consulting sayfaları

Bu içerikten sonraki mantıklı adım için en ilgili solution, role ve industry landing'lerini burada görebilirsin.

Yorumlar

Yorumlar

Bağlantılı Pillar Konular

Bu yazının bağlandığı pillar konular