1. AI Agent Nedir? — Tek Cümlelik Cevap ve Uzun Tanım

LLM ile AI Agent arasındaki temel fark, basit bir cümleyle özetlenebilir: LLM cevap üretir; Agent eylem alır. Bir LLM ChatGPT pencerenizde size cevap verirken, bir Agent aynı sorguyla bir araştırma yapar, e-posta gönderir, dosya düzenler, CRM'de kayıt açar — ve bunu tek seferde değil çoklu-adımlı bir plan üzerinden gerçekleştirir.

Tanım

AI Agent: Belirli bir hedefi gerçekleştirmek için ortamı algılayan, plan yapan, araç (tool) kullanan ve eylemler alan otonom AI sistemi. Tipik mimarisi: hedef + LLM beyni + araç kataloğu + hafıza + döngüsel karar verme. Reaktif değil proaktif; tek-adımlı değil çok-adımlı; deterministik değil hedef-yönelimli.; Ayrıca: Agentic AI, Autonomous AI, LLM Agent

Bu fark bilim kurgu değildir; 2024-2026 döneminde production'da gözlenen somut bir paradigma kaymasıdır. Claude Code, GitHub Copilot Workspace, Cursor Agent, Replit Agent, Devin, OpenAI Operator, Anthropic Computer Use, Microsoft Copilot Studio — hepsi bu paradigmanın somut ürünleri.

Geleneksel LLM Çağrısı vs Agent

Geleneksel kullanım: "Bu PDF'i özetle" → tek bir prompt, tek bir cevap. Agent kullanımı: "Müşterinin son 6 aylık siparişlerini analiz et, en sık aldığı ürün kategorisinin geçen ay stoğu yetersizse satın alma talebi oluştur" → ajan veritabanını sorgular, tabloları analiz eder, stok sistemini kontrol eder, satın alma talebi açar, e-posta gönderir.

2. AI Agent'ın Anatomisi: Dört Çekirdek Bileşen

Bir AI Agent'ı oluşturan dört temel bileşen vardır. Bu dördünü ayrı ayrı tasarlamadan dayanıklı bir agent kurmak mümkün değildir.

2.1. LLM Beyni

Agent'ın akıl yürüten ve karar veren çekirdek motoru. 2026 itibarıyla bayrak agent modelleri:

Claude Opus 4.7 — uzun bağlam (1M), tool use, agent kullanımında lider; Anthropic'in agent-centric eğitim odağı
GPT-5 — function calling, multi-step reasoning, OpenAI Operator entegrasyonu
Gemini 3 Pro — multimodal agent görevleri, Google Workspace entegrasyonu
Açık alternatif — Llama 4 70B, DeepSeek V3, Qwen 2.5 (tool use destekli)

2.2. Hafıza (Memory)

Bir agent'ın "geçmişi hatırlaması" iki katmanda gerçekleşir:

Kısa süreli hafıza (short-term): Aktif görev boyunca context window içinde tutulan konuşma geçmişi, ara çıktılar, plan durumu.
Uzun süreli hafıza (long-term): Vektör DB üzerinde tutulan geçmiş etkileşimler, kullanıcı tercihleri, organizasyonel bilgi. Genelde RAG mimarisi ile entegre edilir.

Tanım

Agent Memory: Bir AI agent'ın görevler arası ve görev içi bilgi tutma katmanı. Kısa süreli hafıza context window'da yaşar; uzun süreli hafıza vektör DB veya yapılandırılmış veritabanında saklanır. Epizodik (yaşanan olaylar), semantik (öğrenilen bilgiler) ve prosedürel (öğrenilen iş akışları) alt-türleri olabilir.

Üç Memory Türü ve Pratik Uygulama

Epizodik hafıza: "Geçen hafta müşteri X ile şu sohbeti yapmıştık" tarzı zaman-bağlamlı olaylar. Vektör DB + timestamp metadata tipik mimari.
Semantik hafıza: "Müşterinin tercih ettiği iletişim kanalı e-posta" tarzı çıkarsanmış kararlı bilgiler. Genelde structured DB (Postgres, MongoDB) içinde.
Prosedürel hafıza: "Bu sektörde fatura itirazı yanıtı şu adımlardan oluşur" tarzı öğrenilmiş iş akışları. Tipik olarak prompt şablonu + örnek-bazlı few-shot referansları.

Memory Framework'leri

Mem0 — açık kaynak, otomatik fact extraction + retrieval
Zep — kullanıcı bazlı uzun-süreli memory + temporal graph
LangMem — LangChain memory yönetimi (semantic + episodic karışımı)
Letta (eski MemGPT) — virtual context (uzun-bağlam simülasyonu)

2.3. Planner

Agent'a "şimdi ne yapacağım?" sorusunu cevaplatan bileşen. Pratikte üç ana strateji kullanılır:

Chain-of-Thought (CoT): "Adım adım düşün" prompt'u ile model kendi muhakemesini açıklar.
ReAct (Reason + Act): Düşünce → Eylem → Gözlem → Düşünce döngüsü. Modern agent'ların en yaygın temel deseni.
Tree-of-Thoughts (ToT): Birden çok plan dalı oluştur, en iyiyi seç. Karmaşık problem çözümünde kalite artırır ama maliyet 3-10x.
Plan-and-Solve: Önce tüm planı çıkar (planning), sonra adım adım uygula (solving). Plan ve yürütme ayrımı eval'i kolaylaştırır; planı insan onayına sunmak için ideal.
ReWOO (Reasoning WithOut Observation): Tool çıktısını beklemeden planı çoklu adım olarak kuran, sonra paralel yürüten yaklaşım. Bağımsız adımlar paralelleşince gecikme %40-60 azalır.
Self-Discover: Modelin verili problem için kendi muhakeme yapısını keşfetmesini sağlayan yöntem (Google DeepMind, 2024). Karmaşık problemlerde +%10-25 kalite kazanımı raporlandı.
Reflexion: Hata yapan agent'ın kendi hatasını analiz edip bir sonraki denemede düzeltmesi. Test/kod-yazma görevlerinde tek adım iyileştirme % 20+ olabilir; ama döngüye girme riski için max-iter sınırı şart.
Graph-of-Thoughts (GoT): ToT'nin genelleştirilmiş hâli — fikirler arasında geri besleme bağlantıları. Akademik araştırma aşamasında, production'a tipik olarak gerek yok.

2.4. Tool / Executor

Agent'ın dış dünyaya etki ettiği katman. Tool kataloğu tipik olarak şunları içerir:

API çağrıları — CRM, ERP, ticket sistemi, hesaplama servisleri
Veritabanı sorguları — SQL, vektör arama
Dosya sistemi işlemleri — okuma, yazma, dönüştürme
Web — tarayıcı, arama API'leri
Kod yürütme — Python sandbox, JavaScript runtime
İletişim — e-posta gönderme, Slack mesajı, Teams notification
MCP sunucuları — standartlaştırılmış üçüncü taraf tool entegrasyonu

3. Agent Karar Döngüsü: Bir Görev Nasıl Yürütülür?

Bir agent görevini şu döngüde tamamlar:

Nasıl Yapılır

Tipik AI Agent Karar Döngüsü

Bir agent'ın hedeften tamamlamaya kadar adımları.

Toplam süre: PT15M

1
1. Hedef Yorumlama
Kullanıcının doğal dil talebi anlaşılabilir alt-hedefler olarak parçalanır.
2
2. Plan Oluşturma
LLM bir plan yapar: hangi araçları, hangi sırayla, hangi parametrelerle çağıracak?
3
3. Tool Seçimi
Plana göre ilk eylem için uygun tool seçilir; argümanlar yapılandırılır.
4
4. Yürütme
Tool çağrılır; sonuç (output, hata, exception) ele alınır.
5
5. Gözlem ve Refleksiyon
Sonuç değerlendirilir: hedefe yaklaştık mı, plan değişmeli mi?
6
6. Plan Güncelleme veya Sonlandırma
Hedef tamamlandıysa cevap üretilir; aksi halde döngüye geri dönülür.
7
7. Hafıza Yazımı
Görev sonunda epizodik hafızaya kayıt yapılır; gelecek görevler için bağlam korunur.

Bu döngünün bir iterasyonu tek bir LLM çağrısı değildir — tipik bir agent görevi 5-50 LLM çağrısı arasında değişebilir. Maliyet ve gecikme yönetimi bu yüzden kritiktir.

4. Agent Mimari Kalıpları (5 Pattern)

Tek bir doğru agent mimarisi yoktur; problem yapısına göre tercih edilen 5 ana pattern bulunur.

4.1. Tek Agent (Single Agent)

En basit form. Bir LLM, bir tool kataloğu, ReAct döngüsü. Müşteri hizmetleri chatbot'u, iç verimlilik aracı, kişisel asistan gibi sınırlı kapsamlı görevler için ideal.

Tek Agent Mimarisi — Ne Zaman Tercih Edilir?
Boyut	Tek Agent	Multi-Agent
Karmaşıklık	Tek-domain görevler	Çoklu uzmanlık alanı
Maliyet	Düşük	Yüksek (token çoğalır)
Eval	Görece kolay	Çok zor
Debug	Doğrudan	İletişim izleme gerekir
Hata payı	Düşük	Yüksek (kaskat hatalar)

4.2. Supervisor (Orkestrasyon)

Bir "yönetici" agent (supervisor), alt görevleri uzmanlaşmış sub-agent'lara delege eder ve sonuçları birleştirir. Bu pattern, LangGraph'ın bayrak kalıbıdır ve 2025-2026 üretim sistemlerinin en yaygın multi-agent yapısıdır.

Tipik yapı:

Supervisor: hedefi anlayıp uygun sub-agent'ı seçer
Researcher: web/RAG ile bilgi toplar
Analyzer: veri analizi yapar
Writer: rapor/cevap yazar
Critic: çıktıyı değerlendirir

4.3. Hierarchical (Hiyerarşik)

Supervisor'ın supervisor'u olan, ağaç yapılı agent organizasyonu. Çok karmaşık projeler (örn. otonom yazılım geliştirme — Devin) bu yapıyı kullanır.

4.4. Swarm (Sürü)

Eş-düzey ajanların paralel çalışıp birbirlerinin çıktısını referans alması. OpenAI'ın "Swarm" framework'ü ve CrewAI'ın "process" modu bu yaklaşımı destekler.

4.5. Network (A2A — Agent-to-Agent)

Agent'lar bağımsız servisler olarak ağ üzerinden iletişim kurar. 2025 sonu / 2026 başında A2A protokolü standartlaşma çalışmaları başladı (Google'ın A2A inisiyatifi). Henüz erken aşama ama bir sonraki büyük adım.

4.6. Agent vs Workflow vs RAG vs Fine-tuning — Karar Matrisi

Her problem agent ile çözülmez. Aşağıdaki matris, doğru aracı seçmenize yardımcı olur.

Hangi Yaklaşım, Hangi Problem İçin?
İhtiyaç	Workflow	RAG	Agent	Fine-tuning
Deterministik çoklu adım	✓ İdeal	-	-	-
Güncel bilgiye erişim	-	✓ İdeal	Kısmi	-
Belgeden cevap üretme	-	✓ İdeal	-	-
Dinamik karar verme	-	-	✓ İdeal	-
Çoklu tool kullanımı	Sınırlı	-	✓ İdeal	-
Stil/format kilitleme	-	-	-	✓ İdeal
Düşük maliyet	✓	✓	Maliyetli	Tek seferlik
Debug kolaylığı	Yüksek	Orta	Düşük	Düşük
Üretime hız	Hafta	Hafta-ay	Ay-çeyrek	Çeyrek

Hibrit Yaklaşım — Yaygın Üretim Mimarisi:

Çoğu olgun üretim sistemi dördünü birlikte kullanır:

Workflow: deterministik ana akışı yönetir (örn. sipariş işleme adımları)
RAG: bilgi sorularına cevap verir (örn. ürün katalog, mevzuat)
Agent: dinamik karar gerektiren noktalar (örn. müşteri itirazı triage)
Fine-tuning: marka tonu ve format şablonu

5. Çekirdek Yetkinlikler: Bir Agent Neler Yapabilir?

Modern agent'ların pratik yetenekleri beş ana kategoriye ayrılır.

5.1. Tool Use / Function Calling

Agent'ın yapılandırılmış API çağrıları yapması. OpenAI Function Calling (Aralık 2023), Anthropic Tool Use (Mart 2024), Gemini Function Calling — hepsi aynı amaca hizmet eder: LLM'in JSON formatında parametreli fonksiyon çağrısı üretmesi.

5.2. Code Execution

Agent'ın güvenli bir sandbox'ta Python (en yaygın) çalıştırması. ChatGPT Code Interpreter / Advanced Data Analysis, Claude'un "execute code" toolu, Replit Agent gibi sistemler bu yetkinliği kullanır. Veri analizi, hesaplama, dönüştürme görevlerinde gücün ana kaynağı.

5.3. Web Browsing

Agent'ın gerçek web tarayıcısını veya arama API'sini kullanarak güncel bilgi toplaması. OpenAI'ın "Browse" özelliği, Anthropic Claude'un Web Search'ü, Gemini Deep Research bu kategoride. Knowledge cutoff sorununu çözer.

5.4. Computer Use

Agent'ın bir bilgisayarın ekranını "görerek" fare ve klavye eylemleriyle uygulamaları kullanması. Anthropic Claude Computer Use (Ekim 2024) ile mainstream'e girdi; OpenAI Operator (Ocak 2025) rakip ürünü. Otonom süreç otomasyonunun yeni nesli.

Görüntü, ses, video anlama yetkinliği agent'ın "duyularını" genişletir. Bir agent ekran görüntüsündeki hata mesajını okuyabilir, müşteri sesini transkripte çevirebilir, video sunumun anahtar dakikalarını çıkarabilir.

6. Popüler Agent Framework'leri

Hangi framework'ü seçeceğiniz, agent'ınızın karmaşıklığı, üretim hedefiniz ve ekibinizin yetkinliklerine bağlıdır.

2026 Agent Framework Karşılaştırması
Framework	Sağlayıcı	Güçlü Tarafı	Üretim Olgunluğu	Türkçe Doküman
LangGraph	LangChain	Stateful, supervisor pattern, çıktı kontrolü	Yüksek	Sınırlı
AutoGen	Microsoft	Multi-agent conversation, code execution	Yüksek	Sınırlı
CrewAI	CrewAI Inc.	Hızlı prototip, rol-tabanlı agent	Orta-yüksek	Sınırlı
OpenAI Agents SDK	OpenAI	Operator, native function calling, Assistants v2	Yüksek	Sınırlı
Anthropic + Claude Code	Anthropic	Computer use, kod yazma, MCP native	Yüksek	Sınırlı
Vercel AI SDK	Vercel	JS/TS, streaming, Next.js native	Yüksek	Var
Smolagents	Hugging Face	Hafif, açık kaynak	Orta	Yok
Agency Swarm	Topluluk	OpenAI Swarm üzerine inşa	Orta	Yok
Semantic Kernel	Microsoft	Plugin-based, .NET/Python	Orta	Sınırlı
PydanticAI	Pydantic	Type-safe, schema-first	Orta	Yok

Detaylı Framework Seçim Rehberi

LangGraph — Production multi-agent için 2026'nın referansı. Stateful graph mimarisi, supervisor pattern'ı native destekler, observability (LangSmith) entegre. Türk şirketlerinde en sık tercih edilen framework.

AutoGen — Microsoft Research kaynaklı. Multi-agent "conversation" paradigması güçlü; code execution native. Microsoft / Azure ekosistemindekiler için doğal seçim.

CrewAI — Hızlı prototip, rol-tabanlı thinking (researcher / writer / critic). MVP'ler ve PoC'ler için ideal; production'a ölçeklenince LangGraph'a geçiş yaygın.

Anthropic Claude Code + MCP — 2025-2026'nın yeni nesil agent geliştirme deneyimi. MCP sayesinde tool kataloğu standartlaştı; Claude'un native agent yetkinliği framework gereksinimini azalttı.

Vercel AI SDK — TypeScript / Next.js dünyasının tercihi. Streaming, tool use, agent loop'lar native. Sukruyusufkaya.com gibi Next.js tabanlı kurumsal sitelerin pratik tercihi.

7. Model Context Protocol (MCP) — 2025'in En Önemli Standardı

Bir agent kuran her ekip aynı problemi yaşıyordu: her bir tool entegrasyonu (Slack, Gmail, CRM, dosya sistemi) ayrı bir kod yazımı gerektiriyordu. Anthropic'in Kasım 2024'te tanıttığı MCP bu sorunu standartlaştırdı.

Tanım

MCP (Model Context Protocol): AI modellerinin harici veri kaynaklarına ve araçlara güvenli, standart bir şekilde bağlanması için Anthropic tarafından tanıtılan açık protokol. Tool sağlayıcıları MCP sunucusu yayınlar; agent geliştiricileri MCP istemcisi olan herhangi bir model ile bağlanır. USB-C'nin donanım için yaptığını AI tool entegrasyonu için yapar.; Ayrıca: Model Context Protocol, AI Tool Standardı

MCP'nin Yapısı

MCP Server: Bir tool / veri kaynağı yayınlar (örn. Slack MCP, Postgres MCP, Filesystem MCP)
MCP Client: Agent kullanan uygulama (Claude Code, Claude Desktop, Cursor, vb.)
Transport: Stdio, HTTP-SSE veya WebSocket üzerinden JSON-RPC

2026 İtibarıyla MCP Ekosistemi

150+ topluluk MCP sunucusu — Slack, GitHub, Linear, Notion, Postgres, Google Drive, Jira, Salesforce
Resmi adopsiyon — OpenAI (Mart 2025), Microsoft Copilot Studio, Google bahar 2025
Türkçe yerel araçlar — KVKK uyumlu MCP sunucusu örnekleri yavaş yavaş çıkmaya başladı

8. Üretim Endişeleri: Bir Agent'ı Canlıya Almak

Bir agent'ı POC'den üretime taşımak, klasik LLM uygulamalarından çok daha zordur. Beş kritik konu:

8.1. Maliyet (Token Patlaması)

Bir tek-prompt LLM çağrısı 2-5K token tüketebilirken, bir agent görevi 20-100K token tüketebilir. Multi-agent görevlerde bu 200-500K'ya çıkar. Bütçe takibi şarttır.

Pratik Maliyet Formülü

Tek bir agent görevinin tahmini token maliyeti:

Maliyet = (Adım sayısı) × (Ortalama input token × input fiyat + Ortalama output token × output fiyat) + Tool çağrı maliyetleri

Örnek hesaplama. 10 adımlık bir agent görevi, her adımda ortalama 4K input + 500 output token, Claude Opus 4.7 ($15 input / $75 output per 1M):

Per-adım maliyet: (4000 × $15 + 500 × $75) / 1M = $0.0975
Toplam görev: 10 × $0.0975 = $0.975 (yaklaşık 1 dolar)
Aynı görev Claude Haiku 4.5 ile ($1 input / $5 output): **$0.065**

10x maliyet farkı = aylık 10K görev için $9.000'a karşı $650. Model routing (basit adımlar Haiku'ya, karmaşık adımlar Opus'a) tipik olarak %60-80 toplam tasarruf sağlar.

Maliyet Optimizasyon Kontrol Listesi

Prompt caching — tekrar eden system prompt'larda %50-90 indirim (Anthropic, OpenAI cached input fiyatlandırması)
Model routing — adım karmaşıklığına göre dinamik LLM seçimi
Tool sonuç caching — aynı tool'un aynı parametrelerle tekrar çağrısında cache hit
Max-iter sınırı — agent döngüsü için katı üst sınır (örn. max 20 adım)
Streaming + early-stop — kullanıcı tatmin olduğunda erken durdurma
Batch API — async iş yükleri için OpenAI/Anthropic %50 indirim

8.2. Güvenilirlik (Reliability)

Agent'lar olasılıksal — aynı girdiyle farklı çıktı üretebilirler. Üretim için deterministik kısımları workflow'a, esnek kısımları agent'a ayırmak iyi pattern'dir. Critical path'leri katı şemalarla (Pydantic, Zod) sertleştirin.

8.3. Gecikme (Latency)

Çoklu adımlı görevlerde toplam yanıt süresi 30 saniyeden dakikalara kadar çıkabilir. Çözümler:

Streaming — kullanıcıya ilerleme göstermek
Paralel tool çağrıları — bağımsız adımları aynı anda
Model routing — basit adımlara küçük model, karmaşık olanlara büyük

8.4. Observability

Agent görevlerinin ne yaptığını izlemek klasik logging'den çok daha karmaşıktır. 2026 araçları:

LangSmith — LangChain ekosistem
Langfuse — açık kaynak alternatif
Helicone — basit, hızlı kurulum
Arize Phoenix — gelişmiş eval entegrasyonu
OpenLLMetry — OpenTelemetry standartı üzerine

8.5. Güvenlik ve Guardrails

Bir agent, eylem alacağı için güvenlik katmanı şarttır:

Tool izinleri — hangi agent hangi tool'a erişebilir?
Dry-run modu — yıkıcı eylemler (silme, ödeme) önce simüle edilir
Human-in-the-Loop (HITL) — kritik eylemler için insan onayı
Prompt injection savunması — kullanıcı girdisinin sistem prompt'unu manipüle etmesine karşı
Sandbox — code execution mutlaka izole edilmiş ortamda

9. Agent Eval: Klasik LLM Eval'inden Niye Farklı?

Bir LLM cevabı tek-noktada değerlendirilebilir (faithfulness, relevance). Bir agent görevi çoklu adım, çoklu tool, çoklu olası çıktı içerir. Eval boyutları:

Agent Eval Boyutları
Boyut	Ne Ölçer?	Kritik Soru
Görev Başarısı (Task Success)	Hedefe ulaşıldı mı?	Kullanıcının istediği sonuç gerçekleşti mi?
Plan Kalitesi	Doğru tool sırası seçildi mi?	Verimsiz adımlar var mı?
Tool Kullanım Doğruluğu	Argümanlar doğru mu, çağrılar valid mi?	Tool şemasına uygun mu?
Adım Verimliliği	Kaç adımda çözüldü?	Optimal adım sayısına yakın mı?
Maliyet	Token + tool çağrısı maliyeti	Bütçe içinde mi?
Gecikme	Toplam görev süresi	Hedef p50/p95 içinde mi?
Güvenlik	Yıkıcı/yanlış eylem var mı?	HITL gerekli yerleri tanıdı mı?

Eval altyapısı: LangSmith, Langfuse, Patronus, Braintrust, DeepEval Agent module. Manuel test setleri (50-200 görev) + otomatik LLM-as-judge + insan değerlendirmesi kombinasyonu pratik standarttır.

10. KVKK + EU AI Act Çerçevesinde Agent'lar

Otonom karar veren bir AI sistemi, regülatif çerçevelerde özellikle hassas kategoridedir.

KVKK Açısından

Kişisel veri otomasyonu. Bir agent müşteri verisini birden çok sistemde işliyorsa, KVKK aydınlatma metni bu otomasyonu içermelidir.
Otomatik karar verme. Tamamen otomatik karar veren agent'lar (örn. kredi onayı), KVKK Madde 11 — Otomatik İşleme'ye Karşı İtiraz hakkı kapsamına girer.
Audit log zorunluluğu. Her agent eyleminin denetlenebilir kayıt altına alınması gerekir.

EU AI Act Açısından

Yüksek risk sınıflandırması. İK seçimi, kredi skorlama, eğitim değerlendirme gibi alanlarda agent çalıştırmak otomatik yüksek-risk kategorisidir.
İnsan denetimi (Madde 14). Yüksek risk agent'ların kritik kararlarda insan onayı süreci gerekir.
Şeffaflık. Kullanıcının bir agent ile etkileşimde olduğunu bilmesi şarttır.

11. Türk Şirketleri için Agent Use-Case'leri

11.1. Müşteri Hizmetleri Agent

Sadece sohbet eden değil, ticket açan, sipariş durumu sorgulayan, iade başlatan, müşteriye sözleşme gönderen agent. Türk telekom ve e-ticaret şirketlerinde 2025-2026 aktif yatırım alanı.

11.2. İç Operasyon Agent

İK onay süreçleri, finans rapor oluşturma, IT ticket triage, satınalma talebi başlatma. Tipik olarak Slack/Teams entegrasyonlu, MCP üzerinden iç sistemlere bağlanır.

11.3. Sales / SDR Agent

Lead araştırma, kişiselleştirilmiş outreach, takip e-postaları, CRM kayıt güncelleme. AI Otomasyon Ajansı (AAA) iş modelinin temeli.

11.4. Research Agent

Pazar araştırması, rakip analizi, akademik literatür taraması, yatırım due diligence. Stratejik karar destek aracı olarak yöneticilere büyük zaman kazandırır.

11.5. Code Agent (Developer Asistanı)

Cursor Agent, Claude Code, Devin, GitHub Copilot Workspace gibi ürünler. Pull request açabilen, test yazabilen, refactor yapabilen ajan geliştiriciler. Yazılım ekiplerinin verimliliğini %30-50 artırdığı raporlanıyor.

11.6. Hukuki Asistan Agent

Sözleşme analizi, mevzuat değişiklik takibi, dava emsali tarama. Hukuk büroları için RAG + agent hibrit mimarisi.

11.7. Operasyonel İzleme Agent

Sistemin alarm verdiğinde otonom triage yapan, log analiz eden, ilk yanıt aksiyonları (rollback, restart) öneren ya da otomatik yapan DevOps/SRE agent'ı.

12. Vaka Çalışmaları (Anonim Türk Şirketleri)

Vaka 1 — Türk Bankası: İç Bilgi Agent'ı

Problem. Banka çalışanları (özellikle çağrı merkezi temsilcileri ve şube personeli) ürün soruları, mevzuat değişiklikleri ve operasyonel prosedürler için sürekli iç bilgi tabanını araştırıyordu. RAG sistemi vardı ama her soru için manuel sorgu gerekiyordu.

Çözüm. LangGraph supervisor + 3 sub-agent (Ürün, Mevzuat, Operasyon). Slack/Teams native entegrasyon. MCP üzerinden iç wiki, ürün kataloğu, mevzuat repo'sundan otomatik bilgi getirme. Çalışan "kart komisyon değişikliği var mı?" gibi doğal dilde soruyor, ajan ilgili sub-agent'a yönlendiriyor, doğru cevap + kaynak gösterimi ile dönüyor.

Sonuç. Çalışan başına haftalık 3.2 saatten 1.1 saate düşen bilgi arama süresi. Çalışan memnuniyeti skoru +18 puan. ROI: 9 ayda yatırımın 4 katı geri ödendi.

Vaka 2 — Hukuk Bürosu: Sözleşme Analiz Agent'ı

Problem. Sözleşme analizi yapan avukatlar her belgeyi manuel okuyup risk maddelerini, eksik şartları ve emsal davaları araştırıyordu. Standart bir sözleşme analizi 4-6 saat sürüyordu.

Çözüm. CrewAI + 4 rol-tabanlı agent: Okuyucu (yapı-tabanlı chunking ile madde madde analiz), Risk Analisti (risk skorlama), Mevzuat (KVKK, TBK, TMK karşılaştırma — RAG ile), Yazar (final özet rapor). Claude Opus 4.7 (1M context, uzun sözleşmeler için ideal) tabanlı.

Sonuç. Sözleşme analiz süresi 4-6 saatten 35 dakikaya. Avukatlar kaynak gösterimli rapor alıyor; final karar her zaman avukat onayında. Bürodaki ortalama dava süresi %22 kısaldı; yıllık $480K ek gelir.

Vaka 3 — E-Ticaret Pazaryeri: Tedarikçi Sales Agent'ı

Problem. Pazaryerine yeni satıcı kazandırma sürecinde her potansiyel tedarikçiye özelleştirilmiş bir teklif paketi hazırlamak günler alıyordu — pazar araştırması, ürün uygunluk analizi, fiyat teklifi, sözleşme taslağı.

Çözüm. OpenAI Operator-tabanlı agent + computer use yetkinliği. Agent CRM'i tarıyor, LinkedIn'den şirket bilgisi topluyor, ürün kataloğunu inceliyor, kişiselleştirilmiş teklif paketi oluşturuyor, sales temsilcisinin onayına sunuyor.

Sonuç. Yeni satıcı onboarding süresi 5 günden 1.5 güne. Onboard edilen aylık satıcı sayısı 2.4x. ROI: 6 ayda 7x.

13. Agent Geliştirme Yol Haritası

Nasıl Yapılır

Sıfırdan Üretime: Agent Geliştirme Yol Haritası

Bir Türk şirketinin sıfırdan üretim kalitesinde agent kurma süreci.

Toplam süre: P6M

1
Hafta 1-2: Use-Case Validation
Hangi sürece agent eklemek değer? Mevcut çözümün maliyeti ne? Beklenen ROI nedir? Tek-agent vs multi-agent uygunluğu?
2
Hafta 3-4: Tool Envanteri ve MCP Stratejisi
Hangi sistemlere entegre olunacak (CRM, ERP, ticket, dosya, mail)? MCP sunucusu var mı, yoksa custom mu yazılacak? KVKK risk değerlendirmesi.
3
Hafta 4-8: MVP Build
Tek-agent ReAct ile MVP. LangGraph veya Vercel AI SDK seçimi. Claude Opus 4.7 veya GPT-5 default LLM. Temel tool seti (5-10 tool).
4
Hafta 8-10: Eval Harness
50-100 görevlik test seti. Task success rate, plan quality, cost-per-task, latency p50/p95 metrikleri. Langfuse veya LangSmith kurulumu.
5
Hafta 10-14: Guardrails ve HITL
Yıkıcı eylem listesi, izin matrisi, HITL onay akışı, audit log, observability dashboard.
6
Hafta 14-18: Production Hardening
Streaming, paralel tool çağrıları, rollback prosedürleri, prompt injection testleri.
7
Hafta 18-22: Pilot Production
Sınırlı kullanıcı grubu, günlük metrik takibi, hızlı iterasyon.
8
Hafta 22-26: Tam Üretim
Tüm kullanıcılara açılma, multi-agent geliştirmeye geçiş (gerekliyse), KVKK uyumu ve dokümantasyon final.

14. Yaygın Hata Patternleri ve Anti-Pattern'ler

Üretim agent projelerinde tekrar tekrar karşılaşılan hatalar:

14.1. "Tek Mega-Agent" Tuzağı

Tek bir agent'a 30+ tool veriliyor, "her şeyi yapsın" deniyor. Sonuç: planner bunalıyor, yanlış tool seçimleri çoğalıyor, eval imkânsızlaşıyor. Çözüm: Görev kapsamını daraltın veya supervisor + uzman sub-agent'lara bölün.

14.2. Eval Olmadan Üretim

"Beta'da test ediyoruz" diyerek eval harness'i atlamak. İlk gerçek hata kullanıcı raporu olduğunda iş işten geçer. Çözüm: Üretim öncesi 50+ task'lık eval set zorunlu; CI'de her PR ile koşulmalı.

14.3. HITL Yokluğu

Tüm kararları otonom yapan agent — kritik eylemlerde insan onayı atlanmış. KVKK + EU AI Act riski. Çözüm: Yıkıcı, mali veya kullanıcı-etkisi yüksek eylemlerde HITL şart.

14.4. Sonsuz Döngüler

Refleksiyon döngüsünde agent kendi cevabını sürekli yeniden değerlendiriyor. Token bombası. Çözüm: Katı max-iter (örn. 20), max-cost ($0.50/task) ve max-time (5 dk) sınırları.

14.5. Prompt Injection'a Açık Tool Use

Kullanıcı girdisi sistem prompt'unu manipüle ediyor; agent yetkisiz tool çağırıyor. Çözüm: Strict input validation, tool kullanım yetkilendirme, sandboxed kod yürütme.

14.6. Observability Olmadan Üretim

"Niye bu agent şöyle yaptı?" sorusuna cevap veremeyiş. Çözüm: Langfuse / LangSmith / Helicone day-1 kurulumu; her tool call, planner kararı, eval skoru saklanmalı.

14.7. "Şeffaflık Yok" Pattern'i

Kullanıcının bir agent'la konuştuğunu bilmemesi — EU AI Act şeffaflık yükümlülüğü ihlali. Çözüm: Net AI bildirimi, agent eylem özetleri, kullanıcıya kontrol mekanizmaları.

14.8. Maliyet Sürprizi

Token bütçesi olmadan production'a çıkmak; ay sonu fatura beklenenden 10x. Çözüm: Per-user, per-task, per-day budget caps + uyarı eşikleri.

15. 2026-2030 Agent Geleceği

1. MCP standardı yaygınlaşıyor. Tüm SaaS ürünlerinin MCP sunucusu yayınlaması 2027'de mecburi konuma geliyor; AI motorları, agent-uyumlu olmayan ürünleri ekosistemde dezavantajlı kılıyor.

2. Computer use mainstream'e geçiyor. Anthropic Computer Use ve OpenAI Operator'ın 2026 olgunlaşmasıyla, RPA pazarı kökten dönüşüyor. UI-Path, Automation Anywhere gibi klasik RPA şirketleri AI-native ürünler tarafından sıkıştırılıyor.

3. Multi-agent A2A standartlaşıyor. Google'ın A2A protokolü ve benzer girişimler, agent'ları bağımsız servisler arası iletişim kurabilir hale getirecek.

4. Specialized vertical agents. Hukuk, sağlık, finans, perakende için özel-eğitimli agent platformları çıkıyor. "Tek bir genel agent" yerine "her sektör için özel agent" trendi güçleniyor.

5. Agent eval framework'leri olgunlaşıyor. 2026 sonunda "agent benchmark" alanı bugünkü "LLM benchmark" alanı kadar olgun olacak.

6. Self-improving agents (sınırlı). Reflection + memory + fine-tuning loop'larla kendini iyileştiren agent'lar araştırma aşamasında; production'a 2027-2028.

7. Regülatif sıkışma. EU AI Act'ın 2026-2027 implementasyonu, otonom karar veren agent'lar için somut yükümlülükler getirir; ABD eyaletleri ve Türkiye benzer yasalar tartışıyor.

16. Sıkça Sorulan Sorular

17. Bir Sonraki Adım

Şirketinizde agent stratejisi belirlemek veya mevcut bir agent uygulamayı üretim kalitesine taşımak için üç hizmet:

Agent mimari atölyesi. Use-case değerlendirme, tek-vs-multi karar, framework seçimi, tool envanteri, KVKK risk haritası — 4 saatlik oturumda netleşir.
Agent eval harness kurulumu. 50-200 görevlik test seti, observability stack, monitoring dashboard. Mevcut agent'ı kalite ölçeğine taşır.
Production audit. Canlı bir agent'ınız varsa maliyet, gecikme, hata, güvenlik, uyum açısından 360 derece denetim ve iyileştirme yol haritası.

İletişim için site üzerindeki contact formunu kullanabilirsiniz.

Kaynaklar

Building Effective Agents — Anthropic, Anthropic · 2024-12-19
ReAct: Synergizing Reasoning and Acting in Language Models — Yao et al., ICLR 2023 · 2022-10-06
Reflexion: Language Agents with Verbal Reinforcement Learning — Shinn et al., NeurIPS 2023 · 2023-03-20
Toolformer: Language Models Can Teach Themselves to Use Tools — Schick et al., NeurIPS 2023 · 2023-02-09
Tree of Thoughts: Deliberate Problem Solving — Yao et al., NeurIPS 2023 · 2023-05-17
Model Context Protocol Specification — Anthropic, Anthropic · 2024-11
LangGraph Documentation — LangChain, LangChain · 2025
AutoGen: Enabling Next-Gen LLM Applications — Microsoft Research, Microsoft · 2024
CrewAI Documentation — CrewAI Inc., CrewAI · 2025
OpenAI Operator — OpenAI, OpenAI · 2025-01
Anthropic Computer Use — Anthropic, Anthropic · 2024-10
Vercel AI SDK — Vercel, Vercel · 2025
EU Artificial Intelligence Act — European Commission, EU · 2024-03
KVKK - 6698 Sayılı Kanun — T.C. KVKK, Türkiye Cumhuriyeti · 2016-04-07

Bu rehber yaşayan bir belgedir; AI Agent ekosistemi (framework'ler, MCP standartları, computer use yetkinlikleri) her çeyrek hızla değiştiği için çeyreklik olarak güncellenmektedir.

Danismanlik Baglantilari

Bu yazıya en yakın consulting sayfaları

Bu içerikten sonraki mantıklı adım için en ilgili solution, role ve industry landing'lerini burada görebilirsin.

Çözüm Bazlı Sayfalar

AI Agent ve Workflow Otomasyonu

Tek adimli chatbot'larin otesine gecen; arac, kural ve insan onayi ile ilerleyen AI destekli is akislarina gecis.

ai agentagentic ai

Landing'i ac

Çözüm Bazlı Sayfalar

AI Evaluation, Guardrails ve Observability

Yapay zeka sistemlerinin dogruluk, guvenlik ve performansini olcmek, izlemek ve kontrollu hale getirmek icin kapsamli degerlendirme katmani.

guardrailsobservability

Landing'i ac

Rol Bazlı Sayfalar

Musteri Hizmetleri Ekipleri icin Bilgi Tabanli AI Asistanlari

Temsilcilere anlik bilgi, cevap onerisi ve surec yonlendirmesi saglayarak hizmet kalitesini ve yanit hizini artiran AI destek sistemleri.

ticket triageTicket triage

Landing'i ac

Paylaş

Tüm Yazılar

1. AI Agent Nedir? — Tek Cümlelik Cevap ve Uzun Tanım

Geleneksel LLM Çağrısı vs Agent

2. AI Agent'ın Anatomisi: Dört Çekirdek Bileşen

2.1. LLM Beyni

2.2. Hafıza (Memory)

Üç Memory Türü ve Pratik Uygulama

Memory Framework'leri

2.3. Planner

2.4. Tool / Executor

3. Agent Karar Döngüsü: Bir Görev Nasıl Yürütülür?

1. Hedef Yorumlama

2. Plan Oluşturma

3. Tool Seçimi

4. Yürütme

5. Gözlem ve Refleksiyon

6. Plan Güncelleme veya Sonlandırma

7. Hafıza Yazımı

4. Agent Mimari Kalıpları (5 Pattern)

4.1. Tek Agent (Single Agent)

4.2. Supervisor (Orkestrasyon)

4.3. Hierarchical (Hiyerarşik)

4.4. Swarm (Sürü)

4.5. Network (A2A — Agent-to-Agent)

4.6. Agent vs Workflow vs RAG vs Fine-tuning — Karar Matrisi

5. Çekirdek Yetkinlikler: Bir Agent Neler Yapabilir?

5.1. Tool Use / Function Calling

5.2. Code Execution

5.3. Web Browsing

5.4. Computer Use

5.5. Multi-Modal Algılama

6. Popüler Agent Framework'leri

Detaylı Framework Seçim Rehberi

7. Model Context Protocol (MCP) — 2025'in En Önemli Standardı

MCP'nin Yapısı

2026 İtibarıyla MCP Ekosistemi

8. Üretim Endişeleri: Bir Agent'ı Canlıya Almak

8.1. Maliyet (Token Patlaması)

Pratik Maliyet Formülü

Maliyet Optimizasyon Kontrol Listesi

8.2. Güvenilirlik (Reliability)

8.3. Gecikme (Latency)

8.4. Observability

8.5. Güvenlik ve Guardrails

9. Agent Eval: Klasik LLM Eval'inden Niye Farklı?

10. KVKK + EU AI Act Çerçevesinde Agent'lar

KVKK Açısından

EU AI Act Açısından

11. Türk Şirketleri için Agent Use-Case'leri

11.1. Müşteri Hizmetleri Agent

11.2. İç Operasyon Agent

11.3. Sales / SDR Agent

11.4. Research Agent

11.5. Code Agent (Developer Asistanı)

11.6. Hukuki Asistan Agent

11.7. Operasyonel İzleme Agent

12. Vaka Çalışmaları (Anonim Türk Şirketleri)

Vaka 1 — Türk Bankası: İç Bilgi Agent'ı

Vaka 2 — Hukuk Bürosu: Sözleşme Analiz Agent'ı

Vaka 3 — E-Ticaret Pazaryeri: Tedarikçi Sales Agent'ı

13. Agent Geliştirme Yol Haritası

Hafta 1-2: Use-Case Validation

Hafta 3-4: Tool Envanteri ve MCP Stratejisi

Hafta 4-8: MVP Build

Hafta 8-10: Eval Harness

Hafta 10-14: Guardrails ve HITL

Hafta 14-18: Production Hardening

Hafta 18-22: Pilot Production

Hafta 22-26: Tam Üretim

14. Yaygın Hata Patternleri ve Anti-Pattern'ler

14.1. "Tek Mega-Agent" Tuzağı

14.2. Eval Olmadan Üretim

14.3. HITL Yokluğu

14.4. Sonsuz Döngüler

14.5. Prompt Injection'a Açık Tool Use

14.6. Observability Olmadan Üretim

14.7. "Şeffaflık Yok" Pattern'i

14.8. Maliyet Sürprizi

15. 2026-2030 Agent Geleceği

16. Sıkça Sorulan Sorular

17. Bir Sonraki Adım