Klasik APM (Datadog, New Relic, Dynatrace) ile LLM observability arasındaki net fark nedir?

Klasik APM deterministic uygulamalar için tasarlandı: endpoint başına latency, error rate, throughput ölçer. LLM uygulamaları non-deterministic'tir: aynı prompt'a farklı yanıtlar, yanıt kalitesi (hallucination, refusal, sycophancy), token-level cost (prompt + completion + reasoning), prompt drift gibi semantic boyutlar var. Klasik APM bu boyutları ölçemez. AI observability platformları (Langfuse, Phoenix, Helicone): trace + span + LLM-specific attributes (model, tokens, cost), eval framework (LLM-as-judge), prompt management, semantic drift detection sunar. 2026 çözümü: AI observability + klasik APM birlikte (Datadog AI Monitoring 2024'te bu yöne gitti). Modül 1 detaylı işler.

Langfuse, Phoenix, Helicone, LangSmith arasında hangisini seçmeliyim?

Senaryoya göre değişir. Open-source + on-premise + KVKK kritik → Langfuse (en yaygın TR kurumsal tercih). RAG-heavy + ML observability geçmişi → Phoenix (Arize ekibinin ML olgunluğu). Zero-config + proxy + cost optimization → Helicone (semantic cache + Cloudflare Edge). LangChain / LangGraph native + commercial support → LangSmith. Hızlı iteration + eval-first + W&B kullanıcı → Weave. Production span analysis + Karpathy ekibi sponsorluğu → Braintrust. Modül 12 capstone'da size uygun seçim yapılır.

OpenTelemetry GenAI Semantic Conventions gerçekten standart oluyor mu?

Evet — 2024-2026 dalga'sında CNCF + OpenTelemetry working group standardı şekillendirdi; Langfuse, Phoenix, Helicone, Datadog AI Monitoring hepsi gen_ai.* namespace'i ve OpenInference / OpenLLMetry'i destekliyor. Traceloop OpenLLMetry SDK ve Arize OpenInference SDK auto-instrumentation sağlıyor (OpenAI, Anthropic, LangChain, LlamaIndex). Bu standardın stratejik faydası: vendor lock-in karşıtı — bir gün Langfuse'tan Phoenix'e geçmek istersen trace'leri taşıyabilirsin. Modül 2 detaylı işler.

Eval-driven observability nedir? Trace-only takipten farkı ne?

Trace-only: 'her LLM çağrısını logla, sonra ihtiyaç olunca aç bak' yaklaşımı — pasif. Eval-driven: her trace'e otomatik kalite skoru (LLM-as-judge + custom evaluator) atanır, regression test CI/CD'de çalışır, prompt değişikliği eval gating'inden geçer. Sonuç: production'a kötü prompt çıkmaz, drift erken yakalanır. Braintrust + Weave + Langfuse eval-first felsefede; Helicone trace-first. Modül 9 ve 6 detaylı işler.

Self-hosted Langfuse vs SaaS Langfuse — hangisi daha doğru?

KVKK + veri egemenliği gerekliyse self-hosted (Türkiye'de finans, sağlık, kamu için zorunlu). SaaS Langfuse Cloud (us / eu region) hızlı başlangıç için uygundur ama Türkçe production verilerinin AB / ABD'ye gitmemesi gerekiyorsa self-hosted şart. Docker Compose 5 dakikalık setup, Kubernetes Helm chart enterprise scale'e taşır. Modül 3.3 KVKK uyumlu self-hosted deployment + PII redaction + Türkçe veri handling detaylı işler.

Reasoning model (o3, R1, Claude Extended Thinking) observability'sinde özel ihtiyaçlar var mı?

Evet — 3 ana ihtiyaç: (1) Reasoning token billing: prompt + completion + reasoning ayrı kategori olarak track edilmeli (OpenAI o3'te reasoning tokens output'tan ayrı ücretlendiriliyor). (2) Thinking trace storage: 16K-128K thinking trace büyük; cost-aware sampling stratejisi gerekli. (3) Reasoning eval: cevap doğruluğu + reasoning kalitesi (PRM-style step-by-step eval) ayrı ölçülmeli. Langfuse + Phoenix 2025 sürümlerinde reasoning token tracking native support ekledi. Modül 8 token breakdown'da reasoning category'i detaylı işler.

Helicone proxy mimarisinin latency overhead'i kabul edilebilir mi?

Cloudflare Workers Edge deployment'ı ile sub-100ms (genellikle 30-80ms) overhead — production LLM çağrılarının (1-30 saniye) yanında ihmal edilebilir. Self-hosted Docker setup'ta network round-trip ~50-150ms olabilir, ancak yine kabul edilebilir. Avantajı: async log ingest, SDK entegrasyon yok, anlık tracing — zero-config. Pratik kural: stream öncelik + sub-second TTFT critical olmayan production senaryoları için Helicone idealdir. Modül 5 detaylı işler.

Agent (multi-step tool calling) observability'si nasıl yapılır?

Agent-spesifik metrikler kritik: tool selection accuracy (doğru aracı çağırma oranı), planning depth (kaç step), max iterations breach rate (sonsuz loop tehlikesi), tool call latency breakdown (LLM call + tool call ayrımı). Phoenix + Langfuse span tree visualization agent debugging için ideal — her tool call ayrı span olarak görselleştirilir. LangGraph + LangSmith native agent trace; Langfuse + LlamaIndex agent integration. Modül 8.3 agent-specific metrik anatomy detaylı işler.

Cost monitoring ile aylık LLM faturasını gerçekten düşürebilir miyim?

Evet — pratik deneyim %30-60 cost reduction gösteriyor. Anahtar: (1) Per-endpoint + per-user attribution ile en pahalı endpoint'lerin tespiti; (2) Semantic cache (Helicone, LiteLLM) ile %30-50 cache hit oranı; (3) Model routing (basit sorgu → Haiku 4.5 / Gemini Flash, karmaşık → Opus 4.7 / GPT-5); (4) Prompt optimization ile token sayısının düşürülmesi (genelde %20-40 azalır); (5) Reasoning model'in sadece gerektiğinde kullanılması (mixed-mode router). Modül 10 cost monitoring + budget alerting detaylı işler.

PII redaction nasıl yapılır? KVKK Türkçe için neye dikkat etmeliyim?

Türkçe için kritik PII kategorileri: TC kimlik numarası (11 hane, modulo 10 + 11 validation), IBAN (TR + 24 hane), telefon (+90 / 0 5XX prefix), email, isim-soyisim, adres. Regex + ML-based detection (Microsoft Presidio + custom Turkish patterns) hibrit yaklaşım önerilir. Langfuse data mask + Helicone vault + Phoenix custom interceptor PII redaction'ı OTLP gateway katmanında yapar — production verisi platform'a şifresiz gitmez. KVKK Üretken AI Rehberi (2024) açıkça PII'nin LLM provider'a gönderilmemesini öneriyor. Modül 2.3, 3.3 ve 12 detaylı işler.

Eğitim sonunda elimde hangi somut artefaktlar olacak?

Capstone projesinde şu artefaktlar üretilir: (1) Kendi production senaryonuza özel observability stack (Langfuse self-hosted + OpenTelemetry GenAI + Phoenix evaluator); (2) Docker Compose / Kubernetes Helm chart deployment template; (3) PII redaction + KVKK uyumlu Türkçe veri handling pipeline; (4) Eval framework (offline CI/CD + online LLM-as-judge); (5) Grafana cost + latency + quality dashboard; (6) PagerDuty alerting + Slack integration + on-call runbook; (7) RCA + blameless post-mortem template'leri; (8) 90 günlük observability roadmap (cost reduction + quality improvement + incident response target'ları).

Eğitim kurumsal ekibimize özel uyarlanabilir mi?

Evet. Standart 3 günlük programın yanında, kurumsal müşteriler için özelleştirilmiş kapalı sınıf versiyonlar düzenliyoruz. Ekibinizin mevcut LLM stack'i (OpenAI / Anthropic / Google / DeepSeek / kendi CPT model'i), mevcut observability altyapısı (Datadog, New Relic, Grafana, ELK), domain (finans, sağlık, hukuk, kamu, e-ticaret), compliance gereksinimleri (KVKK, EU AI Act, ISO/IEC 42001, HIPAA), production SLA hedefleri ve cost optimization öncelikleri dikkate alınarak modül ağırlıkları + capstone senaryoları özelleştirilir.

Bu eğitim hakkında

Production üretken yapay zekâ ve LLM uygulamalarının izlenmesi (observability) disiplinini Türkçe olarak uçtan uca işleyen 3 günlük ileri seviye eğitim. Langfuse, Arize Phoenix + AX, Helicone, Weights & Biases Weave, Braintrust, LangSmith, OpenTelemetry GenAI Semantic Conventions, OpenLLMetry, OpenInference, LiteLLM observability, KVKK uyumlu PII redaction, eval-driven observability, cost + latency + quality monitoring, production incident response dahil.

Bu eğitim şu kitleler için tasarlanmıştır: Production LLM uygulamalarını gözlem ve monitoring disiplinine bağlamak isteyen ML Engineer ve ML Platform Engineer'lar Kurumsal LLM ürünü scale eden ekiplerde MLOps + LLMOps olgunluğu sağlamak isteyen mühendisler AI-powered SaaS ürünlerinin cost + latency + quality SLO/SLI disiplinini kuran senior backend developer'lar On-call rotation + production incident response'dan sorumlu AI/LLM SRE'ler KVKK + EU AI Act + GDPR uyumlu Türkçe AI observability stack'i kurması gereken kurumsal AI compliance ekipleri RAG + agent + reasoning model deployment'ında quality drift ve hallucination'ı sistematik gözleme almak isteyen AI engineer'lar

Bu eğitim neden önemli: Türkiye'de AI observability disiplinini Türkçe + uçtan uca + production-grade işleyen tek ileri seviye program. Langfuse, Phoenix, Helicone, Weave, Braintrust, LangSmith altılı platform karşılaştırması ile doğru seçim disiplini kazandırır. OpenTelemetry GenAI Semantic Conventions ile vendor-agnostic standartlaşma yaklaşımını öğretir. Eval-driven observability (offline + online + LLM-as-judge) ile production quality regresyonu CI/CD'ye taşır. Cost + latency + quality üç boyutlu monitoring + Grafana / Prometheus / Datadog entegrasyonu sunar. Production incident debugging + RCA + blameless post-mortem framework ile operasyonel olgunluk kurar. KVKK + EU AI Act + GDPR uyumlu Türkçe PII redaction + self-hosted deployment disiplinini öğretir. RLHF + Reasoning + Mech Interp + CPT + Quantization + Observability altılı production-grade LLM mühendisliği frontier set'ini tamamlar.

Eğitim sonunda kazanacağınız çıktılar: LLM observability'nin klasik APM'den farkını netçe çerçeveleyebilirsiniz. OpenTelemetry GenAI Semantic Conventions ile vendor-agnostic trace pipeline kurabilirsiniz. Langfuse, Phoenix, Helicone, Weave, Braintrust, LangSmith arasında ekibinize uygun tercih yapabilirsiniz. Self-hosted Langfuse + Helicone + Phoenix deployment kurarak KVKK uyumlu observability sağlayabilirsiniz. Eval-driven observability disiplinini CI/CD pipeline'a entegre edebilirsiniz. Cost + latency + quality üç boyutlu monitoring dashboard'u inşa edebilirsiniz. LLM-as-judge eval framework'ü ile production quality'i sürekli ölçebilirsiniz. Production incident'ları failed trace analysis + RCA + blameless post-mortem ile yönetebilirsiniz. PagerDuty + Slack alerting + on-call rotation + escalation policy kurabilirsiniz. Reasoning model (o3/R1/Claude Extended Thinking) ve agent observability'sinin özel ihtiyaçlarını ele alabilirsiniz.

Ön koşullar ve önerilen birikim: Aktif Python veya Node.js deneyimi (orta-üst seviye), REST API + JSON deneyimi LLM API kullanımı (OpenAI, Anthropic, Google veya self-hosted) ile temel deneyim Docker + Docker Compose + temel Kubernetes bilgisi (self-hosted deployment için) PostgreSQL veya ClickHouse + log analysis temel deneyim OpenTelemetry temelleri (önerilir, eğitimde inşa edilir) Eğitim öncesinde Langfuse, Phoenix, Helicone, LangSmith hesapları (free tier)

Türkiye'de AI observability ve LLM monitoring disiplinini Türkçe uçtan uca işleyen tek production-grade ileri seviye program
Langfuse + Arize Phoenix + Helicone + W&B Weave + Braintrust + LangSmith altılı platform karşılaştırması
OpenTelemetry GenAI Semantic Conventions + OpenLLMetry + OpenInference vendor-agnostic standardı
Eval-driven observability (offline + online + LLM-as-judge + user feedback) disiplini
Trace + span + token + cost + quality + agent metrik anatomi'sinin matematiksel inşası
Cost monitoring + latency SLO/SLI + quality drift detection üç boyutlu monitoring
Production incident debugging + PagerDuty alerting + RCA + blameless post-mortem framework
KVKK + EU AI Act + GDPR uyumlu Türkçe PII redaction + self-hosted observability deployment

Anahtar Çıkarımlar

LLM observability'nin klasik APM'den farkını netçe çerçeveleyebilirsiniz.
OpenTelemetry GenAI Semantic Conventions ile vendor-agnostic trace pipeline kurabilirsiniz.
Langfuse, Phoenix, Helicone, Weave, Braintrust, LangSmith arasında ekibinize uygun tercih yapabilirsiniz.
Self-hosted Langfuse + Helicone + Phoenix deployment kurarak KVKK uyumlu observability sağlayabilirsiniz.
Eval-driven observability disiplinini CI/CD pipeline'a entegre edebilirsiniz.
Cost + latency + quality üç boyutlu monitoring dashboard'u inşa edebilirsiniz.
LLM-as-judge eval framework'ü ile production quality'i sürekli ölçebilirsiniz.
Production incident'ları failed trace analysis + RCA + blameless post-mortem ile yönetebilirsiniz.
PagerDuty + Slack alerting + on-call rotation + escalation policy kurabilirsiniz.
Reasoning model (o3/R1/Claude Extended Thinking) ve agent observability'sinin özel ihtiyaçlarını ele alabilirsiniz.

İleri Seviye3 Gün

AI Observability ve LLM Monitoring Mühendisliği Eğitimi (Langfuse + Phoenix + Helicone + Weave + Braintrust + LangSmith)

Hemen Kaydol

Eğitim Hakkında

Bu eğitim, üretken yapay zekâ ve büyük dil modeli (LLM) uygulamalarını production'da gözlem altına alma, ölçme, değerlendirme ve operasyonel sürdürülebilirliğini sağlama disiplini olan AI observability'i Türkçe olarak uçtan uca işlemek üzere tasarlanmıştır. 2024-2026 dönemi LLM observability platformlarının (Langfuse, Arize Phoenix, Helicone, W&B Weave, Braintrust, LangSmith) doğuş ve standartlaşma yarışına sahne oldu; aynı dönemde OpenTelemetry GenAI Semantic Conventions ile vendor-agnostic trace standardı şekillendi. Türkiye'de bu disiplini matematik + araç stack'i + production deneyimi + KVKK uyumluluğu üçgeninde uçtan uca işleyen bir eğitim neredeyse yoktur — mevcut içerikler ya tek aracın kısa tutoriallerinde takılı kalıyor ya da APM perspektifinde donuyor. Bu program söz konusu boşluğu Türkiye'nin en kapsamlı production-grade AI observability referans eğitimi olarak doldurmak üzere tasarlanmıştır.

Programın stratejik omurgasını, LLM observability'nin klasik APM (Application Performance Monitoring) yaklaşımıyla farkını netleştiren ilk modül oluşturur. Datadog, New Relic, Dynatrace gibi klasik APM çözümlerinin neden LLM uygulamalarında yetersiz kaldığı; semantic output (non-deterministic, anlamsal çıktı), hallucination, prompt drift, cost explosion, token-level cost attribution, RAG retrieval quality, agent tool selection accuracy gibi LLM-spesifik gözlem ihtiyaçları detaylı işlenir. Üretken AI gözlemde 4 pillar (trace + eval + cost + quality drift) çerçevesi kurulur. 2026 ekosistem haritası: Langfuse (open-source, GitHub 13K+ star), Arize Phoenix + AX (ML observability tradition), Helicone (proxy-based, YC W23), W&B Weave + Braintrust (eval-first), LangSmith (LangChain native) karşılaştırılır. Karar çerçevesi: open-source vs SaaS vs enterprise hybrid; self-hosted Langfuse vs Helicone vs Phoenix; KVKK + EU AI Act + GDPR uyumluluk açısından seçim sunulur.

İkinci modül 2024-2026 dönemi AI observability standartlarını şekillendiren OpenTelemetry GenAI Semantic Conventions spesifikasyonunu detaylı işler. gen_ai.* attribute namespace'i (gen_ai.system, gen_ai.request.model, gen_ai.usage.input_tokens), span events (gen_ai.content.prompt, gen_ai.content.completion), metrics (gen_ai.client.token.usage histogram); Traceloop OpenLLMetry SDK ile Python + Node.js auto-instrumentation; Arize OpenInference: OpenAI / Anthropic / LlamaIndex / LangChain wrappers; custom span ekleme ve context propagation pattern'ları. OpenTelemetry Collector ile multi-backend routing (Langfuse + Phoenix paralel), sampling stratejileri (head sampling vs tail sampling, cost vs visibility trade-off), self-hosted OTLP gateway + KVKK uyumlu PII redaction hands-on yapılır. Bu standart sayesinde Langfuse, Phoenix, Helicone, W&B Weave gibi farklı backend'ler arasında trace taşınabilir hale gelir; vendor lock-in karşıtı stratejik avantaj sağlanır.

Üçüncü modül 2024-2026 döneminin lider open-source LLM observability platformu Langfuse'u uçtan uca işler. Python SDK'nın @observe decorator + low-level SDK integration'ı; Node.js + Java SDK + OpenTelemetry adapter kullanımı; trace + span + generation + score hierarchy modeling. Prompt management katmanı: prompt versioning + production label + A/B testing pipeline; dataset oluşturma + ground truth + LLM-as-judge eval framework; custom evaluator (Python function) + scheduled eval runs. Self-hosting tarafında Docker Compose + Kubernetes Helm chart deployment; PostgreSQL + Clickhouse + S3 storage mimarisi; PII redaction + masking + KVKK uyumlu Türkçe veri handling. Türkiye'de kurumsal AI ekiplerinin yaklaşık %80'inin tercih ettiği stack — açık kaynak, esnek, on-premise deploy edilebilir, eval-first felsefede.

Dördüncü modül ML observability geçmişine sahip Arize'ın 2024-2026 sürümlerini detaylı ele alır. Phoenix (open-source, MIT lisanslı, OpenInference standardını şekillendiren) Docker + local setup, OpenInference instrumentation (OpenAI, Anthropic, Bedrock, LlamaIndex, LangChain auto-tracing); span tree visualization + RAG retrieval debugging. Phoenix LLM Evals (built-in evaluators: hallucination, toxicity, relevance, QA correctness, code readability); custom evaluator + LLM-as-judge prompt template'leri; batched eval + Phoenix dashboard üzerinden analiz. Production embedding drift detection + UMAP visualization; RAG context relevance + retrieval quality monitoring; Arize AX SaaS enterprise scaling + multi-tenancy + RBAC. Phoenix'in production embedding monitoring'deki ML olgunluğu, LLM observability'ye taşınan en önemli avantaj — RAG-heavy ekipler için ideal.

Beşinci modül Helicone'un (YC W23, open-source) farklılaştığı proxy mimarisini detaylı ele alır. SDK entegrasyonu olmadan tek base_url değişikliğiyle tracing (OpenAI / Anthropic / OpenRouter); async log ingest + Helicone-Property header'ları ile tagging; custom property + user-level cost attribution. Token usage + cost tracking dashboard + budget alerts; semantic cache ile %30-50 cost reduction reçetesi; rate limiting + retry logic + provider failover. Self-hosting: Helicone OSS Docker setup; Cloudflare Workers Edge deployment ile sub-100ms overhead; Vault (API key rotation + KVKK uyumlu secret management). Geliştirme hızı + zero-config setup tercih eden fast iteration ekipleri için ideal — özellikle Türkiye'deki startup'lar için.

Altıncı modül Weights & Biases ekibinin LLM-spesifik ürünü Weave (2024 lansman) ve Andrej Karpathy + Imbue ekibinin desteklediği Braintrust'ı (eval-first paradigm) detaylı işler. Weave: ML deneyim takibi geçmişi + @weave.op() decorator auto-tracing + dataset versioning + interactive Jupyter / Colab integration + comparison view. Braintrust: braintrust SDK + eval() function ile offline + online eval; AutoEvals library built-in LLM-as-judge prompts; production span analysis + prompt playground. Eval-first felsefe: 'her PR'da regression test' yaklaşımı; CI/CD pipeline entegrasyonu ile prompt değişikliği gating. Hangi ekip Weave/Braintrust, hangisi Langfuse/Phoenix tercih etmeli — karar matrisi detaylı sunulur.

Yedinci modül LangChain ekibinin commercial observability ürünü LangSmith'i (Plus $39/ay, Enterprise SaaS + on-prem) ele alır. LangChain / LangGraph native integration; LANGSMITH_TRACING=true ile zero-config tracing; LangGraph + LangChain Runnable hierarchy trace görselleştirme; run metadata + custom tags ile production debugging. Dataset upload + ground truth + golden answer management; built-in evaluators (correctness, conciseness, helpfulness); experiment compare view + A/B prompt regression test. Prompt Hub (paylaşılan prompt registry + versioning); self-hosted LangSmith (on-prem) Kubernetes deployment; enterprise tier SOC2 + RBAC + audit logging. LangChain / LangGraph ekosistemini kullanan ekipler için en az friction'lı tercih.

Sekizinci modül LLM observability'nin temel veri modelini matematik düzeyinde ele alır. Trace (kullanıcı oturumu) → root span (request) → child span (LLM call + tool call + retriever call + nested chain) → event hierarchy; span types (LLM call, tool call, retriever, custom function); distributed tracing ile microservice arası context propagation. LLM-spesifik metrikler: TTFT (Time To First Token, streaming UX kritik metriği), TPOT (Time Per Output Token, throughput ölçümü), prompt + completion + cached + reasoning token breakdown (reasoning model billing önemli). Cost calculation: model price table + dinamik fiyat hesabı (OpenAI/Anthropic/Gemini güncel pricing); per-user + per-feature + per-endpoint cost attribution. Quality metrics: groundedness, faithfulness, relevance LLM-as-judge implementation. Agent-specific metrics: tool selection accuracy, planning depth, max iterations breach rate.

Dokuzuncu modül production'da LLM kalitesini sistematik gözlem altına almanın merkezindeki eval-driven observability disiplinine ayrılmıştır. Offline eval pipeline: CI/CD pipeline'da prompt değişikliği regression eval; GitHub Actions + Langfuse / Braintrust eval integration; golden dataset versioning + drift detection. Online eval + user feedback: production trace'lerin sürekli LLM-as-judge ile skorlanması; thumbs up/down + structured feedback + NPS collection; user feedback → dataset → eval improvement döngüsü. LLM-as-judge disiplini: judge prompt design + bias mitigation (position bias, length bias, verbosity bias); pairwise comparison + reference-based + reference-free judge; multi-judge ensemble + human-judge agreement validation. Bu disiplin sayesinde production'da quality regression CI/CD'ye kadar geri besleniyor.

Onuncu modül production LLM uygulamasının ekonomik ve operasyonel sürdürülebilirliği için zorunlu üç boyutlu monitoring disiplinini ele alır. Cost monitoring: token usage trend + model dağılımı + endpoint bazlı kırılım; user-level cost attribution + tenant bazlı budgeting; semantic cache hit-rate + cost reduction effectiveness. Latency + SLO/SLI: P50/P95/P99 TTFT + TPOT histogramları; SLO/SLI tanımı ('P95 TTFT < 1.5s, success rate > 99.5%'); error budget + alerting threshold yönetimi. Quality monitoring: hallucination rate + sycophancy drift + refusal rate tracking; Grafana dashboard + Prometheus metrics integration; Datadog LLM Observability + New Relic AI Monitoring overview. Bu üç boyut birlikte kurumsal AI uygulamalarının production sustainability'sini sağlar.

On birinci modül AI observability'nin gerçek hayatta kullanım anına — production incident debugging ve resolution'a — odaklanır. Failed trace analysis: error spans, retry chain, timeout breakdown; provider outage handling (OpenAI 5XX storm, Anthropic capacity throttling, Gemini RPC errors); agent infinite loop + max iteration safeguard pattern'ı. Alerting + on-call: PagerDuty + Slack + Discord alerting integration; threshold tuning + alert fatigue prevention; on-call rotation + escalation policy + runbook hazırlama. RCA + post-mortem: 5-Why + Ishikawa diagramı ile root cause analysis; blameless post-mortem template + action item tracking; Linear / Jira ticket integration + incident retrospective. AI sistemlerinin operasyonel olgunluğu bu disiplinin titizliğine bağlı.

Capstone modülünde her katılımcı, kendi production senaryosuna özel uçtan uca bir AI observability stack'ı tasarlar: provider seçimi (Langfuse self-hosted, Phoenix, Helicone, Weave, Braintrust, LangSmith), entegrasyon yaklaşımı (OpenTelemetry GenAI vs native SDK), eval framework (offline + online), cost + latency + quality monitoring dashboard, alerting + on-call setup, KVKK uyumlu PII redaction, 90 günlük production roadmap. Eğitim sonunda katılımcılar; LLM observability'nin klasik APM'den farkını netçe çerçeveleyebilecek; OpenTelemetry GenAI Semantic Conventions ile vendor-agnostic trace pipeline kurabilecek; Langfuse / Phoenix / Helicone / Weave / Braintrust / LangSmith arasında ekiplerine uygun tercih yapabilecek; eval-driven observability disiplinini CI/CD pipeline'a entegre edebilecek; cost + latency + quality üç boyutlu monitoring dashboard'u inşa edebilecek; production incident'ları failed trace analysis + RCA + post-mortem framework ile yönetebilecek ve KVKK + EU AI Act + GDPR uyumlu Türkçe veri handling pipeline'ı kurabilecek seviyede teknik yetkinliğe ulaşır. Eğitim 3 gün, 12 modül ve 100'ün üzerinde uygulamalı ders içerir.

Eğitim Metodolojisi

Türkiye'de AI observability ve LLM monitoring disiplinini Türkçe uçtan uca işleyen tek production-grade ileri seviye program

Langfuse + Arize Phoenix + Helicone + W&B Weave + Braintrust + LangSmith altılı platform karşılaştırması

OpenTelemetry GenAI Semantic Conventions + OpenLLMetry + OpenInference vendor-agnostic standardı

Eval-driven observability (offline + online + LLM-as-judge + user feedback) disiplini

Trace + span + token + cost + quality + agent metrik anatomi'sinin matematiksel inşası

Cost monitoring + latency SLO/SLI + quality drift detection üç boyutlu monitoring

Production incident debugging + PagerDuty alerting + RCA + blameless post-mortem framework

KVKK + EU AI Act + GDPR uyumlu Türkçe PII redaction + self-hosted observability deployment

Kimler İçindir?

Production LLM uygulamalarını gözlem ve monitoring disiplinine bağlamak isteyen ML Engineer ve ML Platform Engineer'lar

Kurumsal LLM ürünü scale eden ekiplerde MLOps + LLMOps olgunluğu sağlamak isteyen mühendisler

AI-powered SaaS ürünlerinin cost + latency + quality SLO/SLI disiplinini kuran senior backend developer'lar

On-call rotation + production incident response'dan sorumlu AI/LLM SRE'ler

KVKK + EU AI Act + GDPR uyumlu Türkçe AI observability stack'i kurması gereken kurumsal AI compliance ekipleri

RAG + agent + reasoning model deployment'ında quality drift ve hallucination'ı sistematik gözleme almak isteyen AI engineer'lar

Neden Bu Eğitim?

Türkiye'de AI observability disiplinini Türkçe + uçtan uca + production-grade işleyen tek ileri seviye program.

Langfuse, Phoenix, Helicone, Weave, Braintrust, LangSmith altılı platform karşılaştırması ile doğru seçim disiplini kazandırır.

OpenTelemetry GenAI Semantic Conventions ile vendor-agnostic standartlaşma yaklaşımını öğretir.

Eval-driven observability (offline + online + LLM-as-judge) ile production quality regresyonu CI/CD'ye taşır.

Cost + latency + quality üç boyutlu monitoring + Grafana / Prometheus / Datadog entegrasyonu sunar.

Production incident debugging + RCA + blameless post-mortem framework ile operasyonel olgunluk kurar.

KVKK + EU AI Act + GDPR uyumlu Türkçe PII redaction + self-hosted deployment disiplinini öğretir.

RLHF + Reasoning + Mech Interp + CPT + Quantization + Observability altılı production-grade LLM mühendisliği frontier set'ini tamamlar.

Kazanımlar

LLM observability'nin klasik APM'den farkını netçe çerçeveleyebilirsiniz.

OpenTelemetry GenAI Semantic Conventions ile vendor-agnostic trace pipeline kurabilirsiniz.

Langfuse, Phoenix, Helicone, Weave, Braintrust, LangSmith arasında ekibinize uygun tercih yapabilirsiniz.

Self-hosted Langfuse + Helicone + Phoenix deployment kurarak KVKK uyumlu observability sağlayabilirsiniz.

Eval-driven observability disiplinini CI/CD pipeline'a entegre edebilirsiniz.

Cost + latency + quality üç boyutlu monitoring dashboard'u inşa edebilirsiniz.

LLM-as-judge eval framework'ü ile production quality'i sürekli ölçebilirsiniz.

Production incident'ları failed trace analysis + RCA + blameless post-mortem ile yönetebilirsiniz.

PagerDuty + Slack alerting + on-call rotation + escalation policy kurabilirsiniz.

Reasoning model (o3/R1/Claude Extended Thinking) ve agent observability'sinin özel ihtiyaçlarını ele alabilirsiniz.

Gereksinimler

Aktif Python veya Node.js deneyimi (orta-üst seviye), REST API + JSON deneyimi

LLM API kullanımı (OpenAI, Anthropic, Google veya self-hosted) ile temel deneyim

Docker + Docker Compose + temel Kubernetes bilgisi (self-hosted deployment için)

PostgreSQL veya ClickHouse + log analysis temel deneyim

OpenTelemetry temelleri (önerilir, eğitimde inşa edilir)

Eğitim öncesinde Langfuse, Phoenix, Helicone, LangSmith hesapları (free tier)

Eğitim Müfredatı

104 Ders

Modül 1: LLM Observability Disiplinine Stratejik Giriş — Klasik APM'den Farkı9 Ders

Modül 2: OpenTelemetry GenAI Semantic Conventions — Standartlaşan Trace Format'ı9 Ders

Modül 3: Langfuse Derinlemesine — Açık Kaynak LLM Observability'nin Lideri9 Ders

Modül 4: Arize Phoenix ve Arize AX — ML Observability'nin Üretken AI Devamı9 Ders

Modül 5: Helicone — Proxy Tabanlı LLM Observability ve Cost Tracking9 Ders

Modül 6: W&B Weave ve Braintrust — Eval-First LLM Observability9 Ders

Modül 7: LangSmith — LangChain Native Observability9 Ders

Modül 8: Trace + Span Anatomy ve LLM-Spesifik Metrikler9 Ders

Modül 9: Eval-Driven Observability — Online ve Offline Evaluation9 Ders

Modül 10: Cost + Latency + Quality Monitoring — Üç Boyutlu LLM Gözetimi9 Ders

Modül 11: Production Debugging + Alerting + Incident Response9 Ders

Modül 12: Capstone — Multi-Provider Observability Stack İnşası5 Ders

Eğitmen

Şükrü Yusuf KAYA

Yapay Zeka Mimarı | Kurumsal AI & LLM Eğitimleri | Stanford University | Yazılım & Teknoloji Danışmanı

Şükrü Yusuf KAYA, yapay zekâ teknolojilerinin küresel iş dünyasına entegrasyonuna öncülük eden, uluslararası deneyime sahip bir Yapay Zekâ Danışmanı ve Teknoloji Stratejistidir. 6 farklı ülkede faaliyet gösteren KAYA, teknolojinin teorik sınırları ile pratik iş ihtiyaçları arasındaki boşluğu doldurarak, bankacılık, e-ticaret, perakende ve lojistik gibi veri açısından kritik sektörlerde uçtan uca yapay zekâ projelerini yönetmektedir. Özellikle Üretken Yapay Zekâ ve Büyük Dil Modelleri (LLM) alanındaki teknik uzmanlığını derinleştiren KAYA, kuruluşların kısa vadeli çözümlere güvenmek yerine geleceği şekillendiren mimariler oluşturmasını sağlamaktadır. Karmaşık algoritmaları ve gelişmiş sistemleri, kurumsal büyüme hedefleriyle uyumlu somut iş değerine dönüştürmeye yönelik vizyoner yaklaşımı, onu sektörde aranan bir çözüm ortağı haline getirmiştir. Danışmanlık ve proje yönetimi kariyerinin yanı sıra eğitmenlik rolüyle de öne çıkan Şükrü Yusuf KAYA, "Yapay Zekâyı herkes için erişilebilir ve uygulanabilir hale getirmek" mottosuyla hareket etmektedir. Teknik ekiplerden üst düzey yöneticilere kadar geniş bir yelpazedeki profesyoneller için tasarlanmış kapsamlı eğitim programları aracılığıyla, kuruluşların yapay zeka okuryazarlığını artırmaya ve sürdürülebilir bir teknolojik dönüşüm kültürü oluşturmaya öncelik veriyor.

Sıkça Sorulan Sorular

Eğitime Başvur

Sınırlı kontenjan ile butik eğitim.

Gelecek Gruplara Kayıt

Sıradaki grup açıldığında öncelikli bilgi almak için kaydınızı bırakın.

Canlı & İnteraktif Oturumlar

Proje Bazlı Öğrenme

Sektör Odaklı Müfredat

Profesyonel Networking

Birebir Danışmanlık

Eğitmen ile özel görüşme planlayın.

Kaydol

Kategoriler

AI Mühendisliği

Bu eğitim hakkında

Anahtar Çıkarımlar

AI Observability ve LLM Monitoring Mühendisliği Eğitimi (Langfuse + Phoenix + Helicone + Weave + Braintrust + LangSmith)