İçeriğe geç

Tool Use Tarihçesi: Yao 2022 ReAct'tan Anthropic MCP'ye — LLM Ajanlarının 3 Yıllık Doğuşu

LLM ajanlarının tarihsel ve kavramsal anatomisi: Yao vd. 2022 ReAct paper'ı ('Reasoning + Action' birleşmesi), OpenAI function calling (Haziran 2023, ilk standartlaşma), Anthropic MCP (Kasım 2024, açık standart). LangChain, AutoGen, CrewAI gibi framework'lerin yükselişi. 'Niye LLM'ler kendi başına yeterli değil, niye tool kullanmaları gerekiyor?' AGI tartışmasının pratik yüzü. Türkçe ajan use case'leri.

Şükrü Yusuf KAYA
80 dakikalık okuma
İleri
Tool Use Tarihçesi: Yao 2022 ReAct'tan Anthropic MCP'ye — LLM Ajanlarının 3 Yıllık Doğuşu
🛠️ Ekim 2022 — Bir LLM İlk Defa 'Eylem Yaptı'
GPT-4'ün dünyaya geldiği günlerden 5 ay önce, Princeton'da bir doktora öğrencisi Shunyu Yao bir paper yayınladı: 'ReAct: Synergizing Reasoning and Acting in Language Models' (Ekim 2022). Fikir o zamana göre radikaldı: 'LLM'ler sadece metin üretmesin, eylem de yapsın. Düşünsün → eylem et → gözle → tekrar düşün.'
Anda Yao paper'ı yayınladığında dünya bunu fark etmedi. Ama 2 ay sonra ChatGPT çıktı, sonra GPT-4. 'Bu modellerle nasıl gerçek iş yaparız?' sorusu öne çıktı. Cevap: tool use. Ve Yao'nun ReAct paper'ı yol gösterici oldu.
Haziran 2023: OpenAI 'function calling' özelliğini API'ye ekledi. İlk standartlaşma.
Kasım 2024: Anthropic MCP (Model Context Protocol)'ı yayınladı. Açık standart, herkes kullanabilir.
Bu 3 yılda LangChain (Harrison Chase, Ekim 2022), AutoGen (Microsoft, Ağustos 2023), CrewAI (José Vargas, Mart 2024) gibi framework'ler patladı. AI ajan ekosistemi doğdu.
Bu ders 3 yıllık tarihi anlatıyor. Niye tool use gerekti, nasıl evrildi, şimdi ne durumda. Türkçe için pratik anlam: yerel iş süreçleri otomasyonu, Türk e-ticaret API'lerine entegrasyon, KVKK uyumlu ajan tasarımı. 80 dakika sonra: LLM ajanlarının nereden geldiğini, nereye gittiğini, kendi Türkçe ajanınızı kurabilmek için gerekli temeli kavramış olacaksın.

Bu Derste Neler Var? (12 Bölüm)#

  1. Niye LLM tek başına yetmiyor — gerçek dünya problemi
  2. Yao 2022 — ReAct paper'ı: reasoning + action sentezi
  3. ReAct mimari — düşünce → eylem → gözlem döngüsü
  4. OpenAI function calling (Haziran 2023) — ilk standart
  5. Function calling JSON şeması — endüstrinin dili
  6. LangChain'in yükselişi — Harrison Chase'in eseri
  7. AutoGen + CrewAI (2023-2024) — multi-agent framework'ler
  8. Anthropic MCP (Kasım 2024) — açık standart devrimi
  9. MCP vs Function Calling karşılaştırması
  10. Türkçe ajan use case'leri — yerel pazarda fırsatlar
  11. AGI tartışmasının pratik yüzü — 'agentic AI'
  12. Egzersizler

1-3. Yao 2022 ReAct — Reasoning + Action Sentezi#

1.1 Niye LLM tek başına yetmiyor?#

2022 sonu, ChatGPT lansmanı sonrası dünya şu gerçekle yüzleşti:
LLM'ler harika ama sınırlı:
  • Güncel bilgi yok (training cutoff)
  • Hesaplama yapamıyor (1234567 × 8901 = ? → genelde yanlış)
  • Web'e erişimi yok
  • Database sorgulayamıyor
  • Dosya okuyamıyor
  • API çağıramıyor
Pratik örnek: 'Bugünün TL/USD kuru nedir?' → LLM bilmiyor (data 2023'ten).
'Bana en yakın benzin istasyonu' → LLM konumumu bilmiyor.
'Müşterinin hesabındaki son 5 işlemi göster' → LLM database erişemiyor.
LLM'in 'tek başına' bilgi modeli yetersiz. Tool use bu uçurumu kapatmak için.

1.2 ReAct paper künyesi#

'ReAct: Synergizing Reasoning and Acting in Language Models' Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao Princeton + Google Research, Ekim 2022 (ICLR 2023)

1.3 ReAct'ın temel fikri#

2 önceki paradigma vardı:
(A) Reasoning-only: Chain-of-Thought (Wei 2022, Modül 17.1). 'Önce düşün, sonra cevap ver.' Ama eylem yok.
(B) Action-only: WebGPT (OpenAI 2021), 'tool kullanan' modeller. Düşünce yok, doğrudan eylem.
ReAct: ikisini birleştir.
Thought 1: 'Kullanıcı 5 + 3 sordu. Hesap makinesi tool'um var.' Action 1: calculator(5 + 3) Observation 1: 8 Thought 2: 'Hesap 8. Kullanıcıya bunu söyleyebilirim.' Final Answer: 8
Mimari: thought → action → observation → thought → ... döngüsü.

1.4 ReAct mimarisi detay#

LLM her step'te 4 olası output üretebilir:
  • Thought: kendi içsel düşüncesi
  • Action: tool çağrısı (örn.
    calculator(5+3)
    )
  • Observation: tool sonucu (sistem tarafından inject)
  • Final Answer: kullanıcıya nihai cevap
LLM hangisini üreteceğine kendi karar verir (prompt format'ı izleyerek).

2.1 ReAct prompt örneği#

Sen yardımcı bir Türkçe asistansın. Aşağıdaki tool'lara erişimin var: - calculator(expression): matematik hesabı yapar - search(query): web'de arama yapar - wikipedia(topic): Wikipedia özet getirir Format: Thought: <düşünce> Action: <tool_adı>(<argümanlar>) Observation: <tool sonucu> ... (gerekiyorsa tekrarla) Final Answer: <kullanıcıya cevap> Soru: 2024'te kimin Nobel Fizik Ödülü'nü kazandığını bul. Thought: Bu güncel bilgi gerektirir, search kullanmalıyım. Action: search('2024 Nobel Fizik Ödülü kazananı') Observation: John Hopfield ve Geoffrey Hinton 2024 Nobel Fizik Ödülü'nü... Thought: Cevap John Hopfield ve Geoffrey Hinton. Final Answer: 2024 Nobel Fizik Ödülü'nü John Hopfield ve Geoffrey Hinton kazandı.

2.2 ReAct empirik sonuçlar#

HotpotQA (Wikipedia-tabanlı çoklu-hop soru-cevap):
  • Standard prompting: %29 accuracy
  • Chain-of-Thought: %32 accuracy
  • ReAct: %35 accuracy
Fever (gerçek kontrol):
  • CoT: %60
  • ReAct: %64
ReAct, hem CoT (düşünce) hem action'ın avantajlarını birleştiriyor.

4-7. OpenAI Function Calling, LangChain, AutoGen, MCP#

4.1 OpenAI Function Calling (Haziran 2023)#

13 Haziran 2023. OpenAI bir blog post yayınladı: 'Function calling and other API updates'
Fikir: ReAct'ı standardize et. LLM'in tool çağrılarını JSON schema ile tanımla:
{ "name": "get_weather", "description": "Belirtilen şehir için hava durumunu döndürür", "parameters": { "type": "object", "properties": { "location": { "type": "string", "description": "Şehir adı, örn: 'İstanbul, Türkiye'" }, "unit": { "type": "string", "enum": ["celsius", "fahrenheit"] } }, "required": ["location"] } }
Model artık 'tool çağrısını' structured JSON olarak üretiyor:
{ "name": "get_weather", "arguments": { "location": "İstanbul, Türkiye", "unit": "celsius" } }
Kullanıcı kodu bu JSON'u parse edip gerçek fonksiyonu çağırıyor, sonucu LLM'e döndürüyor.

4.2 Function calling'in dramatic etkisi#

Önceden ReAct prompt-based: LLM'in tool çağrılarını metin olarak yazıp parse etmek zor (regex hata yapar).
Function calling: LLM 'eğitilmiş' tool kullanımı. JSON schema'ya uygun çıktı garanti.
6 ay içinde herkes adopt etti: Anthropic Claude (Aralık 2023), Google Gemini (Şubat 2024), Mistral, Meta.

5.1 LangChain'in yükselişi (2022-2024)#

Ekim 2022. Harrison Chase'in açık kaynak Python paket'i: LangChain. AI ajan framework'ü.
Fikir: ReAct, prompt engineering, tool integration, memory, retrieval — hepsini modüler bir framework'te birleştir.
LangChain'in büyümesi astronomik:
  • Ekim 2022: 0 GitHub star
  • Mart 2023: 10K star
  • Eylül 2023: 50K star
  • Mart 2024: 80K star
Production adoption: ChatPDF, Replit, Anyscale gibi büyük şirketler.
Kritik: LangChain çok karmaşık (200+ abstraction). 2024'te 'LangChain'den vazgeçtim' postları yaygın oldu. Alternatives doğdu: Pydantic AI, Instructor, DSPy.

6.1 AutoGen (Microsoft, Ağustos 2023)#

'AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation Framework' Qingyun Wu, Gagan Bansal, Jieyu Zhang, Yiran Wu, ... Microsoft, 2023
LangChain'in tek-ajan paradigmasından öteye: multi-agent. Birden fazla LLM ajanı birbiriyle konuşur.
Örnek:
  • Coder agent: Python kod yazıyor
  • Reviewer agent: kodu inceliyor
  • Tester agent: testleri yazıyor + çalıştırıyor
  • Manager agent: 3'ünü koordine ediyor
Kompleks görevleri ekip çalışması ile çöz.

6.2 CrewAI (Mart 2024)#

Portekizli geliştirici José Vargas tarafından oluşturuldu. AutoGen'in 'role-based' versiyonu.
Her agent bir 'role' alır: 'Senior Engineer', 'Marketing Manager', 'Data Analyst'. LLM bu role'e göre davranıyor.
GitHub: 22K+ star (Mart 2025 itibarıyla). LangChain'e en hızlı yetişen framework.

7.1 Anthropic MCP (Kasım 2024)#

25 Kasım 2024. Anthropic blog: 'Introducing the Model Context Protocol'.
Fikir: function calling'in açık standartı. Tek bir provider'a bağımlı değil.
MCP iki ana bileşen:
  • MCP Server: tool sağlar (örn. dosya sistemi, GitHub, Slack)
  • MCP Client: LLM tarafı, tool'lara erişir
Protokol JSON-RPC over stdio veya HTTP/SSE. Anthropic Claude Desktop ilk MCP client'ı.

7.2 MCP'nin önemi#

Önce: her LLM provider farklı function calling format. OpenAI, Anthropic, Google — hepsi farklı.
MCP: tek protokol, tüm provider'lar. Geliştiriciler bir MCP server yazıyor (örn. GitHub MCP), her LLM bunu kullanabiliyor.
2025 Şubat itibarıyla: 100+ MCP server (GitHub, Slack, Notion, Postgres, vs.). Anthropic + Cursor + Continue.dev + Zed primary clients.

8-10. MCP vs Function Calling + Türkçe + AGI#

8.1 MCP vs OpenAI Function Calling karşılaştırması#

ÖzellikFunction CallingMCP
StandardizasyonOpenAI proprietaryAçık standart
ProtokolJSON schemaJSON-RPC + SSE
Cross-providerHayır (her LLM kendi formatı)Evet (tek protokol)
EcosystemHer şirket ayrıOrtak (MCP servers paylaşılabilir)
Olgunluk2 yıl, çok mature6 ay, gelişiyor
Production useYaygınErken adopter
2025 tahmin: MCP standartlaşırsa function calling deprecate olur. Şu an ikisi paralel.

9.1 Türkçe Agent Use Case'leri#

(1) Türk e-ticaret entegrasyonu:
  • Trendyol, Hepsiburada, n11 API'lerine bağlanan asistan
  • 'Bana son siparişlerimi göster, hangileri tedarikçi olarak Türkiye dışı?'
  • Stock management, fiyat takibi, recommendation
(2) KOBİ muhasebe asistanı:
  • Logo Yazılım, Mikro Yazılım API'lerine bağlı
  • 'Bu ayın KDV beyannamesi hazırla'
  • 'Müşteri X'in bakiyesini göster'
  • E-fatura otomatik kayıt (Modül 19.3 + agent kombinasyonu)
(3) Türk bankacılık asistanı:
  • TEB, Garanti, İş Bankası, Yapı Kredi API'lerine (kısıtlı)
  • 'Bu ay kira ödemesini hatırlat'
  • 'En düşük kart faizini bul'
  • Düzenli ödeme yönetimi
(4) Türkçe içerik üretim ajanı:
  • Hubspot, Mailchimp, Notion entegrasyonu
  • 'Blog yaz, Türkçe SEO uygula, sosyal medya postu üret'
  • Multi-agent: research → write → SEO → schedule
(5) KVKK uyumlu HR asistanı:
  • Türkçe özgeçmiş tarama (Modül 19 multimodal)
  • LinkedIn entegrasyonu (sınırlı, robots.txt)
  • Mülakat soruları üretme
  • KVKK gereği veri anonimleştirme

10.1 'Agentic AI' AGI Tartışmasının Pratik Yüzü#

2024'te endüstri buzz: 'AGI'a (Artificial General Intelligence) ne kadar yakınız?'
İki yaklaşım:
(A) Saf LLM scaling: 'Daha büyük model + daha çok data = AGI'. GPT-5, Claude 4 gibi modeller.
(B) Agentic systems: 'LLM + tools + memory + planning = AGI'. Multi-agent, ReAct + reflection + retrieval.
İkinci yaklaşım pratik kanıtlar veriyor:
  • Devin (Cognition AI 2024): autonomous software engineer agent
  • Operator (OpenAI 2025): web browsing agent
  • Computer Use (Anthropic 2024): computer'ı kontrol eden Claude
'Agentic' yaklaşım 2025'in trendı. Türkçe ekosistem için fırsat: yerel API entegrasyonları, yerel iş süreçleri otomasyonu.
✅ Ders 20.1 Özeti — Tool Use Tarihçesi
LLM ajanlarının 3 yıllık yolculuğu: Yao 2022 ReAct (reasoning + action sentezi, akademik origin) → OpenAI Function Calling Haziran 2023 (ilk standartlaşma, JSON schema) → LangChain ekosistemi 2022-2024 (Harrison Chase, 80K+ star) → AutoGen + CrewAI 2023-2024 (multi-agent paradigması) → Anthropic MCP Kasım 2024 (açık standart, cross-provider). Türkçe ajan fırsatları: Trendyol/Hepsiburada, Logo Yazılım, Türk bankacılık, KOBİ otomasyonu. 'Agentic AI' AGI tartışmasının pratik kanadı — Devin, Operator, Computer Use örnekleri. Sonraki ders: tool use matematiği — function calling JSON şeması, ReAct prompt mühendisliği, MCP protocol implementation.

Sonraki Ders: Tool Use Matematik + Implementation#

Ders 20.2'de tool use iç matematiği + production implementation. Function calling JSON schema standardı detayı, ReAct prompt mühendisliği, MCP protokol implementation. Python'da sıfırdan ReAct ajan + Türkçe tool çağrıları örnek. LangChain alternatif: Pydantic AI ile temiz Türkçe asistan kurulumu.

Sık Sorulan Sorular

**Hem hâlâ kullanılıyor hem de evrildi**: **ReAct prompt format hâlâ pratik**: - Open-source modellerle (Llama-3, Mistral) çalışırken - Function calling desteği zayıf modellerde - Karmaşık reasoning + action chain'lerinde **Function calling daha modern (production)**: - OpenAI, Anthropic, Google direkt destek - Structured output garanti (JSON schema) - Token-efficient (ReAct prompt'tan kısa) **Pratik karar**: - Tier 1 modeller (GPT-4o, Claude, Gemini): function calling - Tier 2 modeller (Llama-3-8B, Mistral): ReAct prompt veya structured output libraries (Instructor, Pydantic AI) ReAct'ın **kavramsal değeri** sürüyor — function calling'in altında ReAct mantığı var. Anlamadan, function calling'i tam kullanamazsın.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

İlgili İçerikler

Bağlantılı Pillar Konular

Bu yazının bağlandığı pillar konular