Bu eğitim başlangıç seviyesi için uygun mu?

Hayır. Bu program ileri seviye bir eğitimdir. Katılımcıların Python, API mantığı, temel veri akışları ve LLM tabanlı uygulamalar hakkında temel farkındalığa sahip olması beklenir.

Bu eğitim yalnızca görsel model kullanımını mı kapsar?

Hayır. Program; metin, görsel, belge, ses ve video tabanlı AI akışlarını; retrieval, tool use, evaluation, güvenlik ve production işletimiyle birlikte ele alır.

Bu eğitim doküman, ses ve video use case'lerini de kapsıyor mu?

Evet. Programda PDF ve form anlama, transcript enrichment, toplantı ve çağrı içeriği işleme, video segment analizi ve multimodal retrieval senaryoları yer alır.

Kuruma özel veri tipleri ve iş akışlarına göre özelleştirme yapılabilir mi?

Evet. İçerik; kurumun sektörüne, veri tiplerine, güvenlik seviyesine, işlem yoğunluğuna, kullanıcı profiline ve hedef ürün mimarisine göre özelleştirilebilir.

Bu eğitim sonunda ekipler somut olarak ne kazanır?

Katılımcılar; daha doğru multimodal use case seçimi, daha güçlü ingestion ve retrieval tasarımı, daha bilinçli tool orchestration yaklaşımı, daha savunulabilir quality assurance ve governance yapısı ve daha sürdürülebilir multimodal AI ürün mimarisiyle programı tamamlar.

Bu eğitim hakkında

Kurumsal şirketler için metin, görsel, belge, ses ve video tabanlı uygulama akışları; multimodal retrieval, tool use, evaluation, güvenlik ve production mimarisini birlikte ele alan ileri seviye multimodal AI eğitimi.

Bu eğitim şu kitleler için tasarlanmıştır: Multimodal AI, GenAI veya belge-görsel-ses-video tabanlı ürünler geliştiren teknik ekipler AI Engineer, ML Engineer, Applied AI, Data Engineer, Platform Engineer ve ürün geliştirme ekipleri Backend, veri platformu, dijital ürün ve teknik liderlik ekipleri Belge, görsel, ekran görüntüsü, çağrı kaydı, toplantı kaydı veya video içeriğini AI uygulamalarına dönüştürmek isteyen şirketler Text-only sistemlerden multimodal sistemlere geçmek isteyen ekipler Multimodal AI uygulamalarını prototipten kurumsal üretime taşımak isteyen kurumlar

Bu eğitim neden önemli: Multimodal AI'ı yalnızca model özelliği değil, kurumsal ürün ve mimari problemi olarak ele almayı öğretir. Şirketlerin metin tabanlı sistemlerde yaşadığı bağlam ve veri tipi sınırlılıklarını görünür hale getirir. Belge, görsel, ses ve video katmanlarını tek bir uygulama akışında nasıl birleştireceğinizi sistematikleştirir. Teknik ekiplerin multimodal retrieval, extraction, orchestration ve evaluation konusunda ortak bir mühendislik dili kurmasına katkı sağlar. Kalite, maliyet, gecikme, güvenlik ve kullanıcı deneyimi arasındaki dengeyi görünür hale getirir. Katılımcıların yalnızca etkileyici demo'lar değil, sürdürülebilir kurumsal multimodal AI ürünleri tasarlamasını hedefler.

Eğitim sonunda kazanacağınız çıktılar: Multimodal AI ihtiyacını use case bazlı analiz edebilirsiniz. Farklı modaliteleri tek ürün akışında doğru konumlandırabilirsiniz. Multimodal ingestion ve processing mimarisi kurabilirsiniz. Retrieval ve tool use katmanlarını daha bilinçli tasarlayabilirsiniz. Güvenlik ve erişim sınırlarını multimodal sistemlere daha erken entegre edebilirsiniz. Multimodal AI uygulamalarını prototipten kurumsal üretime taşıyabilecek daha olgun bir mühendislik yaklaşımı geliştirebilirsiniz.

Ön koşullar ve önerilen birikim: Python programlama konusunda uygulama yapabilecek düzeyde bilgi API, JSON, temel veri akışı ve backend sistemleri hakkında farkındalık LLM, RAG veya AI tabanlı uygulamalar hakkında temel kavramsal bilgi Teknik dokümantasyon okuyabilme ve ürün-mimari tartışmalarına katılabilme Uygulama atölyelerine aktif katılım ve kurumsal use case'ler üzerinden düşünmeye açıklık

Metin, görsel, belge, ses ve video tabanlı AI uygulamalarını tek programda birleştiren ileri seviye multimodal mühendislik yapısı
Salt multimodal prompt örneklerinin ötesine geçerek ürün mimarisi, retrieval, tool use, evaluation ve production işletimi odaklı yaklaşım
Gerçek kurumsal use case'ler, belge işleme, görsel reasoning, çağrı ve toplantı içeriği, video analizi ve otomasyon senaryoları üzerinden uygulamalı anlatım
Ingestion pipeline, preprocessing, multimodal retrieval, structured extraction ve orchestration katmanlarını sistematik biçimde ele alan metodoloji
Veri mahremiyeti, permission-aware retrieval, güvenli storage, policy-aware processing ve governance ihtiyaçlarını mimari tasarımın doğal parçası haline getiren yaklaşım
Ekip içinde tekrar kullanılabilir multimodal AI blueprint'leri, evaluation çerçeveleri, use case taslakları ve production mimari kalıpları üretmeye uygun öğrenme modeli

Anahtar Çıkarımlar

Multimodal AI ihtiyacını use case bazlı analiz edebilirsiniz.
Farklı modaliteleri tek ürün akışında doğru konumlandırabilirsiniz.
Multimodal ingestion ve processing mimarisi kurabilirsiniz.
Retrieval ve tool use katmanlarını daha bilinçli tasarlayabilirsiniz.
Güvenlik ve erişim sınırlarını multimodal sistemlere daha erken entegre edebilirsiniz.
Multimodal AI uygulamalarını prototipten kurumsal üretime taşıyabilecek daha olgun bir mühendislik yaklaşımı geliştirebilirsiniz.

İleri Seviye4 Gün

Multimodal AI Uygulamaları Geliştirme Eğitimi

Hemen Kaydol

Eğitim Hakkında

Bu eğitim, metin tabanlı yapay zekâ uygulamalarının ötesine geçerek görsel, belge, ses ve video gibi farklı veri türlerini tek bir uygulama mimarisinde birleştirmek isteyen teknik ekipler için tasarlanmıştır. Programın merkezinde şu yaklaşım bulunur: güçlü bir multimodal AI ürünü geliştirmek, yalnızca modele farklı dosya tipleri vermekten ibaret değildir. Gerçek kurumsal değer; hangi modalitenin hangi iş problemini çözdüğünü anlamak, giriş verilerini doğru işlemek, modaliteler arası bağlamı korumak, retrieval ve tool use katmanlarını uygun yerde kullanmak, performans ve maliyet dengesini kurmak, güvenlik sınırlarını baştan çizmek ve tüm sistemi üretim seviyesinde yönetilebilir hale getirmekle oluşur. Bu nedenle eğitim; veri akışı, işleme, model kullanımı, uygulama mimarisi, güvenlik, evaluation ve operasyon katmanlarını birlikte ele alır.

Eğitim boyunca katılımcılar, multimodal kararını yalnızca model özelliği olarak değil, ürün ve mimari kararı olarak değerlendirmeyi öğrenir. Her kullanım problemi için video işleme, ses anlama veya görsel reasoning gerekli değildir; bazı use case'lerde belge tabanlı extraction yeterliyken, bazı use case'lerde ekran görüntüsü ve arayüz görselleri kritik hale gelir, bazı senaryolarda ise metin ve ses birlikte anlamlı olur. Bu nedenle program, multimodal AI yaklaşımını teknik moda değil; use case, veri yapısı, kullanıcı deneyimi ve karar karmaşıklığına göre konumlandırır.

Programın güçlü yönlerinden biri multimodal veri akışını çok boyutlu ele almasıdır. Katılımcılar; metin, görsel, ses, video ve belge girdilerinin farklı temsil biçimlerine sahip olduğunu, bu girdilerin preprocessing, parçalama, metadata üretimi, yapılandırılmış extraction, embedding ve retrieval katmanlarında farklı ihtiyaçlar doğurduğunu görür. Böylece multimodal uygulamalar yalnızca dosya yükleme özelliği taşıyan arayüzler değil; farklı veri türleriyle çalışan bilinçli sistemler haline gelir. Eğitim, multimodal veri akışını doğrudan kurumsal iş değeri, doğruluk ve ölçeklenebilirlik bağlamına taşır.

Programın ikinci önemli ekseni multimodal retrieval ve application orchestration katmanıdır. Katılımcılar; belge tabanlı retrieval, image-grounded answer generation, audio transcript enrichment, video segment analysis, multimodal embeddings, hybrid search, structured extraction ve tool-augmented workflows gibi başlıkların tek başına değil, uygulama akışı içinde birlikte tasarlanması gerektiğini öğrenir. Bu sayede multimodal sistemler yalnızca model sorusu-cevabı üreten prototipler olmaktan çıkıp, gerçek iş süreçlerinde veriyi anlayan, birleştiren ve karar destek sağlayan akıllı ürünlere dönüşür.

Program ayrıca multimodal evaluation ve explainability boyutunu detaylandırır. Katılımcılar; bir multimodal sistemin yalnızca genel cevap kalitesiyle değil, modalite bazlı doğruluk, source grounding, extraction consistency, alignment, latency, failure visibility ve kullanıcıya açıklanabilirlik gibi boyutlarla değerlendirilmesi gerektiğini öğrenir. Bu sayede metin-görsel-ses-video sistemleri yalnızca etkileyici demo değil; kalite, güvenlik ve savunulabilirlik açısından daha güçlü kurumsal ürünlere dönüşür.

Bir diğer güçlü boyut güvenlik, erişim sınırları ve governance yaklaşımıdır. Katılımcılar; hassas belge ve görsellerin yönetimi, ses ve video içeriklerinde mahremiyet, policy-aware processing, private storage, permission-aware retrieval, auditability, güvenli loglama, release kontrolü ve multimodal veri yaşam döngüsü gibi konuları ele alır. Böylece multimodal AI sistemleri yalnızca çalışan prototipler değil; kurumsal güvenlik ve yönetişim altında işletilen servisler haline gelir.

Programın son önemli odağı production mimarisi ve runtime işletimidir. Katılımcılar; ingestion pipeline, API katmanı, storage design, multimodal embeddings, orchestration, observability, incident management, release yönetimi, cost control ve capability roadmap gibi konuları değerlendirir. Bu sayede multimodal AI uygulamaları yalnızca deneme amaçlı projeler değil; sürdürülebilir ve ölçeklenebilir kurumsal ürün mimarileri olarak konumlanır.

Eğitim Metodolojisi

Metin, görsel, belge, ses ve video tabanlı AI uygulamalarını tek programda birleştiren ileri seviye multimodal mühendislik yapısı

Salt multimodal prompt örneklerinin ötesine geçerek ürün mimarisi, retrieval, tool use, evaluation ve production işletimi odaklı yaklaşım

Gerçek kurumsal use case'ler, belge işleme, görsel reasoning, çağrı ve toplantı içeriği, video analizi ve otomasyon senaryoları üzerinden uygulamalı anlatım

Ingestion pipeline, preprocessing, multimodal retrieval, structured extraction ve orchestration katmanlarını sistematik biçimde ele alan metodoloji

Veri mahremiyeti, permission-aware retrieval, güvenli storage, policy-aware processing ve governance ihtiyaçlarını mimari tasarımın doğal parçası haline getiren yaklaşım

Ekip içinde tekrar kullanılabilir multimodal AI blueprint'leri, evaluation çerçeveleri, use case taslakları ve production mimari kalıpları üretmeye uygun öğrenme modeli

Kimler İçindir?

Multimodal AI, GenAI veya belge-görsel-ses-video tabanlı ürünler geliştiren teknik ekipler

AI Engineer, ML Engineer, Applied AI, Data Engineer, Platform Engineer ve ürün geliştirme ekipleri

Backend, veri platformu, dijital ürün ve teknik liderlik ekipleri

Belge, görsel, ekran görüntüsü, çağrı kaydı, toplantı kaydı veya video içeriğini AI uygulamalarına dönüştürmek isteyen şirketler

Text-only sistemlerden multimodal sistemlere geçmek isteyen ekipler

Multimodal AI uygulamalarını prototipten kurumsal üretime taşımak isteyen kurumlar

Neden Bu Eğitim?

Multimodal AI'ı yalnızca model özelliği değil, kurumsal ürün ve mimari problemi olarak ele almayı öğretir.

Şirketlerin metin tabanlı sistemlerde yaşadığı bağlam ve veri tipi sınırlılıklarını görünür hale getirir.

Belge, görsel, ses ve video katmanlarını tek bir uygulama akışında nasıl birleştireceğinizi sistematikleştirir.

Teknik ekiplerin multimodal retrieval, extraction, orchestration ve evaluation konusunda ortak bir mühendislik dili kurmasına katkı sağlar.

Kalite, maliyet, gecikme, güvenlik ve kullanıcı deneyimi arasındaki dengeyi görünür hale getirir.

Katılımcıların yalnızca etkileyici demo'lar değil, sürdürülebilir kurumsal multimodal AI ürünleri tasarlamasını hedefler.

Kazanımlar

Multimodal AI ihtiyacını use case bazlı analiz edebilirsiniz.

Farklı modaliteleri tek ürün akışında doğru konumlandırabilirsiniz.

Multimodal ingestion ve processing mimarisi kurabilirsiniz.

Retrieval ve tool use katmanlarını daha bilinçli tasarlayabilirsiniz.

Güvenlik ve erişim sınırlarını multimodal sistemlere daha erken entegre edebilirsiniz.

Multimodal AI uygulamalarını prototipten kurumsal üretime taşıyabilecek daha olgun bir mühendislik yaklaşımı geliştirebilirsiniz.

Gereksinimler

Python programlama konusunda uygulama yapabilecek düzeyde bilgi

API, JSON, temel veri akışı ve backend sistemleri hakkında farkındalık

LLM, RAG veya AI tabanlı uygulamalar hakkında temel kavramsal bilgi

Teknik dokümantasyon okuyabilme ve ürün-mimari tartışmalarına katılabilme

Uygulama atölyelerine aktif katılım ve kurumsal use case'ler üzerinden düşünmeye açıklık

Eğitim Müfredatı

60 Ders

Modül 1: Multimodal AI'e Giriş ve Kurumsal Kullanım Senaryoları6 Ders

Modül 2: Multimodal Veri Akışı, Ingestion ve Preprocessing Mimarisi6 Ders

Modül 3: Document AI, PDF Understanding ve Yapılandırılmış Bilgi Çıkarımı6 Ders

Modül 4: Görsel Anlama, Image Reasoning ve Screen-Based AI Senaryoları6 Ders

Modül 5: Ses, Konuşma ve Video Tabanlı Multimodal Uygulamalar6 Ders

Modül 6: Multimodal Retrieval, Embeddings ve Tool-Augmented Application Orchestration6 Ders

Modül 7: Evaluation, Explainability ve Multimodal Quality Assurance6 Ders

Modül 8: Security, Privacy, Permission-Aware Processing ve Governance6 Ders

Modül 9: Production Mimari, API Katmanı, Observability ve Runtime Operasyonları6 Ders

Modül 10: Capstone – Multimodal AI Ürün Blueprint'i ve Üretime Geçiş6 Ders

Eğitmen

Şükrü Yusuf KAYA

Yapay Zeka Mimarı | Kurumsal AI & LLM Eğitimleri | Stanford University | Yazılım & Teknoloji Danışmanı

Şükrü Yusuf KAYA, yapay zekâ teknolojilerinin küresel iş dünyasına entegrasyonuna öncülük eden, uluslararası deneyime sahip bir Yapay Zekâ Danışmanı ve Teknoloji Stratejistidir. 6 farklı ülkede faaliyet gösteren KAYA, teknolojinin teorik sınırları ile pratik iş ihtiyaçları arasındaki boşluğu doldurarak, bankacılık, e-ticaret, perakende ve lojistik gibi veri açısından kritik sektörlerde uçtan uca yapay zekâ projelerini yönetmektedir. Özellikle Üretken Yapay Zekâ ve Büyük Dil Modelleri (LLM) alanındaki teknik uzmanlığını derinleştiren KAYA, kuruluşların kısa vadeli çözümlere güvenmek yerine geleceği şekillendiren mimariler oluşturmasını sağlamaktadır. Karmaşık algoritmaları ve gelişmiş sistemleri, kurumsal büyüme hedefleriyle uyumlu somut iş değerine dönüştürmeye yönelik vizyoner yaklaşımı, onu sektörde aranan bir çözüm ortağı haline getirmiştir. Danışmanlık ve proje yönetimi kariyerinin yanı sıra eğitmenlik rolüyle de öne çıkan Şükrü Yusuf KAYA, "Yapay Zekâyı herkes için erişilebilir ve uygulanabilir hale getirmek" mottosuyla hareket etmektedir. Teknik ekiplerden üst düzey yöneticilere kadar geniş bir yelpazedeki profesyoneller için tasarlanmış kapsamlı eğitim programları aracılığıyla, kuruluşların yapay zeka okuryazarlığını artırmaya ve sürdürülebilir bir teknolojik dönüşüm kültürü oluşturmaya öncelik veriyor.

Sıkça Sorulan Sorular

Eğitime Başvur

Sınırlı kontenjan ile butik eğitim.

Gelecek Gruplara Kayıt

Sıradaki grup açıldığında öncelikli bilgi almak için kaydınızı bırakın.

Canlı & İnteraktif Oturumlar

Proje Bazlı Öğrenme

Sektör Odaklı Müfredat

Profesyonel Networking

Birebir Danışmanlık

Eğitmen ile özel görüşme planlayın.

Talep üzerine - Kaydol

Kategoriler

AI Mühendisliği

Bu eğitim hakkında

Anahtar Çıkarımlar

Multimodal AI Uygulamaları Geliştirme Eğitimi