Bu eğitim hakkında
OpenAI o3/o4, DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking, Qwen3 Reasoning ve GLM-4.6 paradigmasını uçtan uca işleyen; test-time compute scaling, process reward modeling, R1-style RL emergence, reasoning distillation (S1/LIMO), Tree-of-Thoughts/MCTS pattern'ları ve production inference (vLLM/SGLang/TensorRT-LLM) konularını birleştiren 3 günlük ileri seviye Türkçe reasoning model mühendisliği eğitimi.
Bu eğitim şu kitleler için tasarlanmıştır: Reasoning model'leri (o3/o4/R1/Gemini Deep Think/Claude Extended Thinking) kurumsal ürünlere entegre etmek isteyen AI Engineer'lar Kendi açık kaynak reasoning model'ini (Qwen3, R1-distill) domain'ine özel eğitmek isteyen ML Engineer'lar AI Research'ta R1-style RL emergence ve test-time compute scaling üzerinde çalışan AI Researcher'lar Matematik, kod, hukuk, klinik veya finansal reasoning sistemi inşa etmek isteyen senior backend developer'lar Production reasoning model serving (vLLM, SGLang) ve cost optimization yapması gereken ML Platform mühendisleri Reasoning model'lerin maliyetini düşürmek için mixed-mode + thinking budget routing kurmak isteyen teknik liderler
Bu eğitim neden önemli: OpenAI o3/o4, DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking, Qwen3 Reasoning paradigmasını Türkçe işleyen tek production-grade ileri seviye programdır. Test-time compute scaling, R1-style RL emergence ve reasoning distillation reçetelerini bir arada öğretir. Reasoning model + klasik prompt-CoT pattern'ları (CoT, ToT, MCTS, Reflexion) karşılaştırmalı kanıt-tabanlı analiz sunar. Mixed-mode + thinking budget mühendisliği ile production'da %40-70 cost reduction reçetesi kazandırır. vLLM, SGLang, TensorRT-LLM ile long-trace reasoning serving disiplinini öğretir. AIME, MATH-500, GPQA Diamond, ARC-AGI, SWE-bench Verified, FrontierMath modern benchmark setini uçtan uca kapsar. Kendi domain'inize özel reasoning sistemi tasarlama disiplini (math tutor, code agent, legal reasoner) ile capstone üretimi sağlar. RLHF eğitimiyle tamamlayıcı: orada hizalama algoritmaları, burada reasoning model'leri kullanma ve dağıtma.
Eğitim sonunda kazanacağınız çıktılar: OpenAI o3/o4, DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking iç yapılarını çözebilirsiniz. Test-time compute scaling yasalarını uygulayarak compute bütçesini kanıt-tabanlı optimize edebilirsiniz. Outcome Reward ve Process Reward Model arasında doğru seçim yapabilirsiniz. R1-style RL ile kendi reasoning model'inizi eğitebilirsiniz. S1, LIMO, Bespoke-Stratos distillation reçeteleriyle az veriyle güçlü reasoning model üretebilirsiniz. Chain-of-Thought, Tree-of-Thoughts, Self-Refine, Reflexion, MCTS pattern'larını implement edebilirsiniz. Mixed-mode reasoning + dynamic thinking budget ile reasoning maliyetini %40-70 düşürebilirsiniz. vLLM, SGLang, TensorRT-LLM ile reasoning model'leri production'da serve edebilirsiniz. Modern benchmark setiyle (AIME, MATH-500, GPQA, ARC-AGI, SWE-bench) reasoning sistemi değerlendirebilirsiniz. Kendi domain'inize özel (math/code/legal/clinical/financial) reasoning sistemi tasarlayabilirsiniz.
Ön koşullar ve önerilen birikim: Aktif Python deneyimi (orta-üst seviye), PyTorch ve HuggingFace Transformers temel kullanımı LLM API kullanımı (OpenAI, Anthropic veya Google) temel deneyim Linear algebra, olasılık ve gradient descent gibi ML temel matematiği RLHF/DPO kavramlarına temel aşinalık (önerilir; RLHF eğitimi tamamlayıcıdır) Eğitim öncesinde GPU erişimi (RunPod, Lambda Labs, Modal) — H100 veya 2x A100 önerilir Eğitim öncesinde OpenAI o3 / Claude Opus / Gemini 2.5 Pro / DeepSeek R1 API erişimi
- OpenAI o3/o4, DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking ve Qwen3 reasoning paradigmasını uçtan uca işleyen Türkiye'deki tek ileri seviye program
- Test-time compute scaling yasalarını (Snell 2024) parallel + sequential + search-tabanlı scaling pattern'larıyla derinlemesine kapsama
- Outcome Reward (ORM) ve Process Reward (PRM) farkını Math-Shepherd, Tülu 3 PRM, Implicit PRM ile kanıt-tabanlı netleştirme
- R1-Zero (pure RL) ve R1 (multi-stage) pipeline'larının iç yapısı + rule-based reward tasarım reçetesi
- Reasoning distillation reçeteleri: OpenThoughts, S1, LIMO, Bespoke-Stratos, DeepScaleR ile az veriyle reasoning
- CoT, ToT, Self-Refine, Reflexion, RAP, MCTS pattern'larının Python implementasyonu + benchmark karşılaştırması
- Hibrit/mixed-mode reasoning ve thinking budget mühendisliği ile %40-70 cost reduction reçetesi
- Production inference (vLLM, SGLang, TensorRT-LLM) ve modern benchmark seti (AIME, MATH-500, GPQA, ARC-AGI, SWE-bench) uçtan uca disiplin
Anahtar Çıkarımlar
- OpenAI o3/o4, DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking iç yapılarını çözebilirsiniz.
- Test-time compute scaling yasalarını uygulayarak compute bütçesini kanıt-tabanlı optimize edebilirsiniz.
- Outcome Reward ve Process Reward Model arasında doğru seçim yapabilirsiniz.
- R1-style RL ile kendi reasoning model'inizi eğitebilirsiniz.
- S1, LIMO, Bespoke-Stratos distillation reçeteleriyle az veriyle güçlü reasoning model üretebilirsiniz.
- Chain-of-Thought, Tree-of-Thoughts, Self-Refine, Reflexion, MCTS pattern'larını implement edebilirsiniz.
- Mixed-mode reasoning + dynamic thinking budget ile reasoning maliyetini %40-70 düşürebilirsiniz.
- vLLM, SGLang, TensorRT-LLM ile reasoning model'leri production'da serve edebilirsiniz.
- Modern benchmark setiyle (AIME, MATH-500, GPQA, ARC-AGI, SWE-bench) reasoning sistemi değerlendirebilirsiniz.
- Kendi domain'inize özel (math/code/legal/clinical/financial) reasoning sistemi tasarlayabilirsiniz.
Reasoning Models Mühendisliği Eğitimi (o3, o4, DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking)
OpenAI o3/o4, DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking, Qwen3 Reasoning ve GLM-4.6 paradigmasını uçtan uca işleyen; test-time compute scaling, process reward modeling, R1-style RL emergence, reasoning distillation (S1/LIMO), Tree-of-Thoughts/MCTS pattern'ları ve production inference (vLLM/SGLang/TensorRT-LLM) konularını birleştiren 3 günlük ileri seviye Türkçe reasoning model mühendisliği eğitimi.
Eğitim Hakkında
Bu eğitim, OpenAI o1'in Eylül 2024'te lansmanıyla başlayan ve 2025-2026 boyunca DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking, Qwen3 Reasoning, GLM-4.6-thinking ve GPT-5 reasoning modu ile dünya AI ekosisteminin merkezine yerleşen reasoning LLM paradigmasını uçtan uca işlemek üzere tasarlanmıştır. Reasoning model'leri klasik LLM'lerden ayıran şey sadece daha uzun çıktı değil; chain-of-thought davranışının post-training sürecinde explicit hedef olarak eğitilmesi, thinking trace ile final answer arasındaki yapısal ayrım, test-time compute'un model performansının birinci dereceden belirleyicisi haline gelmesi ve süreç ödüllendirme (process reward) ile alignment paradigmasının değişmesidir. Türkiye'de bu disiplini System 1 vs System 2 düşünme teorisi, R1-style RL emergence, reasoning distillation reçeteleri, MCTS-tabanlı search, hibrit/mixed-mode reasoning ve production inference engineering ile uçtan uca işleyen bir eğitim neredeyse yoktur; mevcut içerikler ya o1/R1 makale özetlerinde kalıyor ya da prompt-CoT seviyesinde yüzeysel. Bu program söz konusu boşluğu Türkiye'nin en kapsamlı production-grade reasoning models referans eğitimi olarak doldurmak üzere tasarlanmıştır.
Programın stratejik omurgasını, klasik chat LLM (System 1 — hızlı/sezgisel) ve reasoning LLM (System 2 — yavaş/deliberatif) arasındaki yapısal farkı net çerçeveleyen ilk modül oluşturur. Kahneman'ın dual-process bilişsel modeli LLM düzlemine projekte edilir; OpenAI o1 → o3 → o4 evrimi, DeepSeek R1'in Ocak 2025'te yarattığı açık kaynak şoku, Gemini 2.5 Deep Think + Claude Extended Thinking + Qwen3'ün takip eden hareketleri tarihsel olarak haritalandırılır. Hangi görevde reasoning, hangi görevde klasik LLM optimal — bu soruya somut karar matrisi sunulur: matematik olimpiyat seviyesinde problem çözme, algoritma tasarımı, complex code debugging, multi-step planning, scientific reasoning, formal verification görevlerinde reasoning model belirgin üstün; kısa soru-cevap, hızlı RAG, summarization, basit translation görevlerinde klasik LLM daha verimli. Cost-latency-quality üçgeninde optimal seçim disiplini kazandırılır.
Reasoning model'lerin iç anatomisini ele alan ikinci modül, post-training sürecinde chain-of-thought davranışının nasıl induce edildiğini, thinking blocks ile output token arasındaki yapısal ayrımı, ve provider bazlı protokol farklarını uçtan uca işler. Anthropic Claude Extended Thinking API'nin thinking blocks + budget_tokens (1K-32K) yapısı; OpenAI Reasoning Items + reasoning_effort (minimal / low / medium / high) parametreleri; Google Gemini 2.5 Pro Thoughts + thinking_config; DeepSeek R1 ve Qwen3'ün ... protokolü; GLM-4.6-thinking yaklaşımı — her birinin avantajları, sınırları ve API kullanım detayları gösterilir. Hidden reasoning trace (OpenAI'in summary-only policy'si) ile open reasoning trace (DeepSeek R1'in tam trace'i) arasındaki strategic ve security trade-off netleştirilir; reasoning trace'in prompt injection attack surface'i olarak rol oynaması ve mitigation stratejileri ele alınır.
Reasoning model eğitiminin en kritik bileşeni olan reward sinyalini iki perspektiften ele alan üçüncü modül outcome reward (ORM) ve process reward (PRM) ayrımını detaylı işler. ORM yaklaşımında math problem'in nihai cevabı (SymPy exact match + numeric tolerance), code'un test pass-rate'i (pytest) veya format compliance (regex verifier) gibi kural-tabanlı sinyallerle reward verilir; DeepSeek-Math ve R1'in başarısının temel taşı bu yaklaşımdır. PRM ise her ara reasoning adımını puanlar — AllenAI Tülu 3 PRM (2025), Math-Shepherd otomatik process supervision üretimi, OpenAI PRM800K dataset, Yuan 2024 Implicit PRM (outcome reward'dan PRM türetme) yaklaşımları karşılaştırmalı işlenir. Hangi reasoning görevinde ORM, hangisinde PRM optimal — bu karar somut benchmark verisiyle netleştirilir; PRM'in reward hacking riskleri ve mitigation reçetesi sunulur.
Programın teorik zirvesi, Charlie Snell ve DeepMind ekibinin 2024'te tanıttığı test-time compute scaling yasalarına ayrılan dördüncü modüldür. Pre-train compute ile test-time compute arasındaki marjinal kazanım dengesi, görev zorluğuna göre optimal compute allocation, parallel scaling (best-of-N, self-consistency majority vote, weighted voting with PRM), sequential scaling (Self-Refine ve Reflexion ile iteratif iyileştirme), search-tabanlı scaling (MCTS, REBASE, beam-guided) yöntemleri kapsamlı şekilde işlenir. 1 GPU-saat reasoning compute'unun 1 GPU-saat pre-training compute ile karşılaştırması somut FLOPS ekonomisi ile yapılır; compute bütçesinin görev zorluğuna göre dinamik tahsis edilmesi disiplini kazandırılır.
Beşinci modül DeepSeek R1 ve R1-Zero pipeline'larını uçtan uca çözümler. R1-Zero — cold-start SFT olmadan pure RL ile reasoning emergence'in mümkün olduğunu kanıtlayan ilk model — paradigmatik bir bulgudur; aha-moment olgusu, reasoning length emergence, language mixing problemi ve mitigation reçetesi detaylı işlenir. R1'in multi-stage pipeline'ı (SFT cold-start → reasoning RL → SFT karışım → general RL) adım adım çözümlenir. Rule-based reward design — math için SymPy exact match + numeric tolerance, code için pytest pass-rate, format compliance için regex verifier — pratik olarak yapılır. Open-source reproduction projeleri (HuggingFace Open-R1, ByteDance DAPO, SimpleRL-Zoo, TinyZero, Open-Reasoner-Zero) karşılaştırmalı incelenir; katılımcılar kendi 7B-32B base model'lerinde GRPO + rule-based reward ile reasoning emergence deneyebilir.
Altıncı modül, R1 ve diğer büyük reasoning model'lerin yeteneklerini 1.5B-32B kompakt modellere SFT-tabanlı distillation ile aktarmanın mühendisliğini ele alır. OpenThoughts-114K, S1.1K (Stanford 2025 — 1.000 örnekle o1-mini seviyesi), LIMO-817 (sadece 817 örnekle %95 AIME doğruluğu), Bespoke-Stratos-32B, Sky-T1, DeepScaleR-1.5B projelerinin dataset oluşturma reçeteleri, teacher model'den (R1 / o3 / Gemini Deep Think) reasoning trace toplama stratejileri, quality filtering disiplini (zorluk + doğruluk + çeşitlilik dengelemesi) detaylı işlenir. Türkçe matematik, kod ve hukuk domain'inde özel reasoning distillation pipeline'ı kurulur; Qwen3-0.5B veya Llama 3.2 1B base model üzerine domain-specific reasoning model üretilir. Distillation + GRPO hibrit yaklaşımı production reçetesi olarak sunulur.
Yedinci modül, dedicated reasoning model olmadan klasik LLM'ler üzerinde dahi reasoning davranışını uyandıran sezgisel prompt + inference pattern'larını uçtan uca işler. Chain-of-Thought (Wei 2022), Self-Consistency (Wang 2023), Tree-of-Thoughts (Yao 2023), Self-Refine (Madaan 2023), Reflexion (Shinn 2023), Reasoning via Planning (Hao 2023), Plan-and-Solve (Wang 2023) algoritmalarının her biri matematik formülasyonu + Python implementasyonu + benchmark sonuçlarıyla işlenir. Native reasoning model (R1, o3) vs prompt-tabanlı CoT (GPT-4o, Claude Sonnet) karşılaştırması somut benchmark'larla yapılır — hangi senaryoda native reasoning, hangisinde prompt-tabanlı pattern yeterli olduğu kanıt-tabanlı netleştirilir.
Sekizinci modül DeepMind AlphaZero'nun MCTS yaklaşımının LLM reasoning'e uyarlanmasını detaylı ele alır. Selection (UCB) → Expansion → Simulation → Backpropagation MCTS döngüsü LLM token tree'sine projekte edilir; PRM-guided MCTS ile step value tahmini, ReST-MCTS (Zhang 2024) self-training pipeline, REBASE algoritması (beam-search-style cost-efficient MCTS), AlphaMath (MCTS + LLaMA matematik reasoning) projelerinin implementasyon detayları gösterilir. vLLM ile parallel rollout, c_puct exploration parametresi tuning'i, ve MCTS budget control (zaman, FLOPS, max-depth) production örnekleri ile aktarılır.
Dokuzuncu modül, modern reasoning model'lerin (Claude Opus 4.7, Qwen3, GLM-4.6, GPT-5) çoğunun sunduğu hibrit/mixed-mode yapılarını ve thinking budget mühendisliğini ele alır. Anthropic budget_tokens (1K-32K) + interleaved thinking; OpenAI reasoning_effort parametresi; Qwen3 /think /no_think directive; GLM-4.6 thinking_mode; Gemini 2.5 thinking_config — hepsi pratik karşılaştırmalı işlenir. Sorgu zorluğunu tahmin eden classifier ile dinamik thinking budget routing'i, stage-based budget ile early-exit, confidence-aware routing (classic LLM → reasoning fallback pattern) tasarımı yapılır. Production deneyimde bu disiplin reasoning maliyetini %40-70 düşürür.
Onuncu modül, reasoning model'lerin uzun thinking trace'lerini (4K-32K token) production'da düşük latency ve yüksek throughput ile serve etmenin engineering disiplinini ele alır. vLLM continuous batching + PagedAttention, SGLang RadixAttention + reasoning-aware caching (shared reasoning prefix optimization), TensorRT-LLM speculative decoding (EAGLE-3, MEDUSA), NVIDIA Dynamo inference platform, AMD MI325X ve TPU v6/v7 reasoning inference performance karşılaştırması ile aktarılır. Prefix cache ile sistem prompt + few-shot reasoning'in yeniden kullanımı, KV cache pagination, draft model + verify ile 2-4x latency azaltma reçetesi pratik gösterilir.
On birinci modül, reasoning model'leri değerlendiren modern benchmark setini uçtan uca işler. AIME 2024-2026 (yüksek lise olimpiyat — symbolic checker), MATH-500 (Hendrycks), GPQA Diamond (graduate-level fen), FrontierMath (Tao 2024 — en zor matematik), ARC-AGI 1 ve 2 (Chollet abstract reasoning), LiveCodeBench (timestamp-aware kod), SWE-bench Verified (gerçek GitHub PR çözme), Codeforces ELO, IOI 2024, HumanEval+ — her biri detaylı çözümlenir. Saturation analizi (o3 + R1'in 2026'da hâlâ açtığı benchmark'lar), data contamination tespiti (canary strings + n-gram analizi), pass@k / cons@N / maj@N metrikleri ve custom domain benchmark (hukuk, sağlık, finans) üretimi disiplini kazandırılır.
Capstone modülünde her katılımcı, kendi domain'i için end-to-end bir reasoning sistemi inşa eder: senaryo seçimi (matematik tutor, kod debug agent, hukuk reasoner, klinik triaj sistemi, finansal modelleme asistanı veya katılımcının kendi use-case'i); model seçimi (Claude Opus 4.7 + Extended Thinking, OpenAI o3/o4, DeepSeek R1, Qwen3, distilled S1/LIMO); reasoning pattern (native reasoning, CoT, ToT, MCTS, hibrit); production inference stack (vLLM, SGLang veya TensorRT-LLM); evaluation framework (custom domain benchmark + AIME/MATH-500 baseline); 90 günlük operational roadmap (cost monitoring, thinking budget tuning, reasoning router optimization). Eğitim sonunda katılımcılar; OpenAI o3/o4, DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking ve Qwen3'ün iç yapısını çözebilecek; test-time compute scaling yasalarını uygulayarak compute bütçesini optimize edebilecek; R1-style RL ile reasoning emergence pipeline'ı kurabilecek; distillation reçeteleriyle (S1, LIMO, Bespoke-Stratos) kendi reasoning model'ini üretebilecek; MCTS, ToT, Self-Refine, Reflexion pattern'larını implement edebilecek; vLLM / SGLang / TensorRT-LLM ile reasoning model serve edebilecek ve modern benchmark setiyle değerlendirme yapabilecek seviyede teknik yetkinliğe ulaşır. Eğitim 3 gün, 12 modül ve 100'ün üzerinde uygulamalı ders içerir.
Eğitim Metodolojisi
OpenAI o3/o4, DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking ve Qwen3 reasoning paradigmasını uçtan uca işleyen Türkiye'deki tek ileri seviye program
Test-time compute scaling yasalarını (Snell 2024) parallel + sequential + search-tabanlı scaling pattern'larıyla derinlemesine kapsama
Outcome Reward (ORM) ve Process Reward (PRM) farkını Math-Shepherd, Tülu 3 PRM, Implicit PRM ile kanıt-tabanlı netleştirme
R1-Zero (pure RL) ve R1 (multi-stage) pipeline'larının iç yapısı + rule-based reward tasarım reçetesi
Reasoning distillation reçeteleri: OpenThoughts, S1, LIMO, Bespoke-Stratos, DeepScaleR ile az veriyle reasoning
CoT, ToT, Self-Refine, Reflexion, RAP, MCTS pattern'larının Python implementasyonu + benchmark karşılaştırması
Hibrit/mixed-mode reasoning ve thinking budget mühendisliği ile %40-70 cost reduction reçetesi
Production inference (vLLM, SGLang, TensorRT-LLM) ve modern benchmark seti (AIME, MATH-500, GPQA, ARC-AGI, SWE-bench) uçtan uca disiplin
Kimler İçindir?
Neden Bu Eğitim?
OpenAI o3/o4, DeepSeek R1, Gemini 2.5 Deep Think, Claude Extended Thinking, Qwen3 Reasoning paradigmasını Türkçe işleyen tek production-grade ileri seviye programdır.
Test-time compute scaling, R1-style RL emergence ve reasoning distillation reçetelerini bir arada öğretir.
Reasoning model + klasik prompt-CoT pattern'ları (CoT, ToT, MCTS, Reflexion) karşılaştırmalı kanıt-tabanlı analiz sunar.
Mixed-mode + thinking budget mühendisliği ile production'da %40-70 cost reduction reçetesi kazandırır.
vLLM, SGLang, TensorRT-LLM ile long-trace reasoning serving disiplinini öğretir.
AIME, MATH-500, GPQA Diamond, ARC-AGI, SWE-bench Verified, FrontierMath modern benchmark setini uçtan uca kapsar.
Kendi domain'inize özel reasoning sistemi tasarlama disiplini (math tutor, code agent, legal reasoner) ile capstone üretimi sağlar.
RLHF eğitimiyle tamamlayıcı: orada hizalama algoritmaları, burada reasoning model'leri kullanma ve dağıtma.
Kazanımlar
Gereksinimler
Eğitim Müfredatı
104 DersEğitmen

Şükrü Yusuf KAYA
Yapay Zeka Mimarı | Kurumsal AI & LLM Eğitimleri | Stanford University | Yazılım & Teknoloji Danışmanı
Şükrü Yusuf KAYA, yapay zekâ teknolojilerinin küresel iş dünyasına entegrasyonuna öncülük eden, uluslararası deneyime sahip bir Yapay Zekâ Danışmanı ve Teknoloji Stratejistidir. 6 farklı ülkede faaliyet gösteren KAYA, teknolojinin teorik sınırları ile pratik iş ihtiyaçları arasındaki boşluğu doldurarak, bankacılık, e-ticaret, perakende ve lojistik gibi veri açısından kritik sektörlerde uçtan uca yapay zekâ projelerini yönetmektedir. Özellikle Üretken Yapay Zekâ ve Büyük Dil Modelleri (LLM) alanındaki teknik uzmanlığını derinleştiren KAYA, kuruluşların kısa vadeli çözümlere güvenmek yerine geleceği şekillendiren mimariler oluşturmasını sağlamaktadır. Karmaşık algoritmaları ve gelişmiş sistemleri, kurumsal büyüme hedefleriyle uyumlu somut iş değerine dönüştürmeye yönelik vizyoner yaklaşımı, onu sektörde aranan bir çözüm ortağı haline getirmiştir. Danışmanlık ve proje yönetimi kariyerinin yanı sıra eğitmenlik rolüyle de öne çıkan Şükrü Yusuf KAYA, "Yapay Zekâyı herkes için erişilebilir ve uygulanabilir hale getirmek" mottosuyla hareket etmektedir. Teknik ekiplerden üst düzey yöneticilere kadar geniş bir yelpazedeki profesyoneller için tasarlanmış kapsamlı eğitim programları aracılığıyla, kuruluşların yapay zeka okuryazarlığını artırmaya ve sürdürülebilir bir teknolojik dönüşüm kültürü oluşturmaya öncelik veriyor.
Sıkça Sorulan Sorular
Eğitime Başvur
Sınırlı kontenjan ile butik eğitim.
Gelecek Gruplara Kayıt
Sıradaki grup açıldığında öncelikli bilgi almak için kaydınızı bırakın.
Birebir Danışmanlık
Eğitmen ile özel görüşme planlayın.
Kategoriler
İlgili eğitimler
Claude Code ile Profesyonel Yazılım Geliştirme Eğitimi
Anthropic'in agentic kodlama platformu Claude Code'u kurumsal seviyede ustalaşmak isteyen yazılım profesyonelleri için kapsamlı, ileri seviye 4 günlük eğitim programı. MCP entegrasyonları, Hooks, Sub-agents, Skills ve Claude Agent SDK ile production-grade agent mimarisi.
4 GünadvancedRLHF, DPO ve GRPO ile LLM Hizalama Mühendisliği Eğitimi
RLHF (PPO), DPO, KTO, IPO, SimPO, ORPO ve DeepSeek R1 GRPO algoritmalarını matematik + kod düzeyinde işleyen; reward model, Constitutional AI, RLAIF, reasoning model hizalaması ve TRL/Axolotl/LLaMA-Factory/OpenRLHF/verl araç zincirini production-grade biçimde öğreten 3 günlük ileri seviye Türkçe LLM hizalama eğitimi.
3 GünadvancedClaude Agent SDK ile AI Ajan Geliştirme Eğitimi
Anthropic'in Claude Agent SDK'sı ile production-grade AI ajanları geliştirmek isteyen yazılım mühendisleri için kapsamlı, ileri seviye 4 günlük program. Tool use orkestrasyonu, MCP server geliştirme, multi-agent desenleri, prompt caching ve evaluation engineering.
4 Günadvanced