Skip to content
Hero Background
İleri Seviye4 Gün

Multimodal AI Uygulamaları Geliştirme Eğitimi

Kurumsal şirketler için metin, görsel, belge, ses ve video tabanlı uygulama akışları; multimodal retrieval, tool use, evaluation, güvenlik ve production mimarisini birlikte ele alan ileri seviye multimodal AI eğitimi.

Eğitim Hakkında

Bu eğitim, metin tabanlı yapay zekâ uygulamalarının ötesine geçerek görsel, belge, ses ve video gibi farklı veri türlerini tek bir uygulama mimarisinde birleştirmek isteyen teknik ekipler için tasarlanmıştır. Programın merkezinde şu yaklaşım bulunur: güçlü bir multimodal AI ürünü geliştirmek, yalnızca modele farklı dosya tipleri vermekten ibaret değildir. Gerçek kurumsal değer; hangi modalitenin hangi iş problemini çözdüğünü anlamak, giriş verilerini doğru işlemek, modaliteler arası bağlamı korumak, retrieval ve tool use katmanlarını uygun yerde kullanmak, performans ve maliyet dengesini kurmak, güvenlik sınırlarını baştan çizmek ve tüm sistemi üretim seviyesinde yönetilebilir hale getirmekle oluşur. Bu nedenle eğitim; veri akışı, işleme, model kullanımı, uygulama mimarisi, güvenlik, evaluation ve operasyon katmanlarını birlikte ele alır.

Eğitim boyunca katılımcılar, multimodal kararını yalnızca model özelliği olarak değil, ürün ve mimari kararı olarak değerlendirmeyi öğrenir. Her kullanım problemi için video işleme, ses anlama veya görsel reasoning gerekli değildir; bazı use case'lerde belge tabanlı extraction yeterliyken, bazı use case'lerde ekran görüntüsü ve arayüz görselleri kritik hale gelir, bazı senaryolarda ise metin ve ses birlikte anlamlı olur. Bu nedenle program, multimodal AI yaklaşımını teknik moda değil; use case, veri yapısı, kullanıcı deneyimi ve karar karmaşıklığına göre konumlandırır.

Programın güçlü yönlerinden biri multimodal veri akışını çok boyutlu ele almasıdır. Katılımcılar; metin, görsel, ses, video ve belge girdilerinin farklı temsil biçimlerine sahip olduğunu, bu girdilerin preprocessing, parçalama, metadata üretimi, yapılandırılmış extraction, embedding ve retrieval katmanlarında farklı ihtiyaçlar doğurduğunu görür. Böylece multimodal uygulamalar yalnızca dosya yükleme özelliği taşıyan arayüzler değil; farklı veri türleriyle çalışan bilinçli sistemler haline gelir. Eğitim, multimodal veri akışını doğrudan kurumsal iş değeri, doğruluk ve ölçeklenebilirlik bağlamına taşır.

Programın ikinci önemli ekseni multimodal retrieval ve application orchestration katmanıdır. Katılımcılar; belge tabanlı retrieval, image-grounded answer generation, audio transcript enrichment, video segment analysis, multimodal embeddings, hybrid search, structured extraction ve tool-augmented workflows gibi başlıkların tek başına değil, uygulama akışı içinde birlikte tasarlanması gerektiğini öğrenir. Bu sayede multimodal sistemler yalnızca model sorusu-cevabı üreten prototipler olmaktan çıkıp, gerçek iş süreçlerinde veriyi anlayan, birleştiren ve karar destek sağlayan akıllı ürünlere dönüşür.

Program ayrıca multimodal evaluation ve explainability boyutunu detaylandırır. Katılımcılar; bir multimodal sistemin yalnızca genel cevap kalitesiyle değil, modalite bazlı doğruluk, source grounding, extraction consistency, alignment, latency, failure visibility ve kullanıcıya açıklanabilirlik gibi boyutlarla değerlendirilmesi gerektiğini öğrenir. Bu sayede metin-görsel-ses-video sistemleri yalnızca etkileyici demo değil; kalite, güvenlik ve savunulabilirlik açısından daha güçlü kurumsal ürünlere dönüşür.

Bir diğer güçlü boyut güvenlik, erişim sınırları ve governance yaklaşımıdır. Katılımcılar; hassas belge ve görsellerin yönetimi, ses ve video içeriklerinde mahremiyet, policy-aware processing, private storage, permission-aware retrieval, auditability, güvenli loglama, release kontrolü ve multimodal veri yaşam döngüsü gibi konuları ele alır. Böylece multimodal AI sistemleri yalnızca çalışan prototipler değil; kurumsal güvenlik ve yönetişim altında işletilen servisler haline gelir.

Programın son önemli odağı production mimarisi ve runtime işletimidir. Katılımcılar; ingestion pipeline, API katmanı, storage design, multimodal embeddings, orchestration, observability, incident management, release yönetimi, cost control ve capability roadmap gibi konuları değerlendirir. Bu sayede multimodal AI uygulamaları yalnızca deneme amaçlı projeler değil; sürdürülebilir ve ölçeklenebilir kurumsal ürün mimarileri olarak konumlanır.

Eğitim Metodolojisi

Metin, görsel, belge, ses ve video tabanlı AI uygulamalarını tek programda birleştiren ileri seviye multimodal mühendislik yapısı

Salt multimodal prompt örneklerinin ötesine geçerek ürün mimarisi, retrieval, tool use, evaluation ve production işletimi odaklı yaklaşım

Gerçek kurumsal use case'ler, belge işleme, görsel reasoning, çağrı ve toplantı içeriği, video analizi ve otomasyon senaryoları üzerinden uygulamalı anlatım

Ingestion pipeline, preprocessing, multimodal retrieval, structured extraction ve orchestration katmanlarını sistematik biçimde ele alan metodoloji

Veri mahremiyeti, permission-aware retrieval, güvenli storage, policy-aware processing ve governance ihtiyaçlarını mimari tasarımın doğal parçası haline getiren yaklaşım

Ekip içinde tekrar kullanılabilir multimodal AI blueprint'leri, evaluation çerçeveleri, use case taslakları ve production mimari kalıpları üretmeye uygun öğrenme modeli

Kimler İçindir?

Multimodal AI, GenAI veya belge-görsel-ses-video tabanlı ürünler geliştiren teknik ekipler
AI Engineer, ML Engineer, Applied AI, Data Engineer, Platform Engineer ve ürün geliştirme ekipleri
Backend, veri platformu, dijital ürün ve teknik liderlik ekipleri
Belge, görsel, ekran görüntüsü, çağrı kaydı, toplantı kaydı veya video içeriğini AI uygulamalarına dönüştürmek isteyen şirketler
Text-only sistemlerden multimodal sistemlere geçmek isteyen ekipler
Multimodal AI uygulamalarını prototipten kurumsal üretime taşımak isteyen kurumlar

Neden Bu Eğitim?

1

Multimodal AI'ı yalnızca model özelliği değil, kurumsal ürün ve mimari problemi olarak ele almayı öğretir.

2

Şirketlerin metin tabanlı sistemlerde yaşadığı bağlam ve veri tipi sınırlılıklarını görünür hale getirir.

3

Belge, görsel, ses ve video katmanlarını tek bir uygulama akışında nasıl birleştireceğinizi sistematikleştirir.

4

Teknik ekiplerin multimodal retrieval, extraction, orchestration ve evaluation konusunda ortak bir mühendislik dili kurmasına katkı sağlar.

5

Kalite, maliyet, gecikme, güvenlik ve kullanıcı deneyimi arasındaki dengeyi görünür hale getirir.

6

Katılımcıların yalnızca etkileyici demo'lar değil, sürdürülebilir kurumsal multimodal AI ürünleri tasarlamasını hedefler.

Kazanımlar

Multimodal AI ihtiyacını use case bazlı analiz edebilirsiniz.
Farklı modaliteleri tek ürün akışında doğru konumlandırabilirsiniz.
Multimodal ingestion ve processing mimarisi kurabilirsiniz.
Retrieval ve tool use katmanlarını daha bilinçli tasarlayabilirsiniz.
Güvenlik ve erişim sınırlarını multimodal sistemlere daha erken entegre edebilirsiniz.
Multimodal AI uygulamalarını prototipten kurumsal üretime taşıyabilecek daha olgun bir mühendislik yaklaşımı geliştirebilirsiniz.

Gereksinimler

Python programlama konusunda uygulama yapabilecek düzeyde bilgi
API, JSON, temel veri akışı ve backend sistemleri hakkında farkındalık
LLM, RAG veya AI tabanlı uygulamalar hakkında temel kavramsal bilgi
Teknik dokümantasyon okuyabilme ve ürün-mimari tartışmalarına katılabilme
Uygulama atölyelerine aktif katılım ve kurumsal use case'ler üzerinden düşünmeye açıklık

Eğitim Müfredatı

60 Ders
01
Modül 1: Multimodal AI'e Giriş ve Kurumsal Kullanım Senaryoları6 Ders
02
Modül 2: Multimodal Veri Akışı, Ingestion ve Preprocessing Mimarisi6 Ders
03
Modül 3: Document AI, PDF Understanding ve Yapılandırılmış Bilgi Çıkarımı6 Ders
04
Modül 4: Görsel Anlama, Image Reasoning ve Screen-Based AI Senaryoları6 Ders
05
Modül 5: Ses, Konuşma ve Video Tabanlı Multimodal Uygulamalar6 Ders
06
Modül 6: Multimodal Retrieval, Embeddings ve Tool-Augmented Application Orchestration6 Ders
07
Modül 7: Evaluation, Explainability ve Multimodal Quality Assurance6 Ders
08
Modül 8: Security, Privacy, Permission-Aware Processing ve Governance6 Ders
09
Modül 9: Production Mimari, API Katmanı, Observability ve Runtime Operasyonları6 Ders
10
Modül 10: Capstone – Multimodal AI Ürün Blueprint'i ve Üretime Geçiş6 Ders

Eğitmen

Şükrü Yusuf KAYA

Şükrü Yusuf KAYA

Yapay Zeka Mimarı | Kurumsal AI & LLM Eğitimleri | Stanford University | Yazılım & Teknoloji Danışmanı

Şükrü Yusuf KAYA, yapay zekâ teknolojilerinin küresel iş dünyasına entegrasyonuna öncülük eden, uluslararası deneyime sahip bir Yapay Zekâ Danışmanı ve Teknoloji Stratejistidir. 6 farklı ülkede faaliyet gösteren KAYA, teknolojinin teorik sınırları ile pratik iş ihtiyaçları arasındaki boşluğu doldurarak, bankacılık, e-ticaret, perakende ve lojistik gibi veri açısından kritik sektörlerde uçtan uca yapay zekâ projelerini yönetmektedir. Özellikle Üretken Yapay Zekâ ve Büyük Dil Modelleri (LLM) alanındaki teknik uzmanlığını derinleştiren KAYA, kuruluşların kısa vadeli çözümlere güvenmek yerine geleceği şekillendiren mimariler oluşturmasını sağlamaktadır. Karmaşık algoritmaları ve gelişmiş sistemleri, kurumsal büyüme hedefleriyle uyumlu somut iş değerine dönüştürmeye yönelik vizyoner yaklaşımı, onu sektörde aranan bir çözüm ortağı haline getirmiştir. Danışmanlık ve proje yönetimi kariyerinin yanı sıra eğitmenlik rolüyle de öne çıkan Şükrü Yusuf KAYA, "Yapay Zekâyı herkes için erişilebilir ve uygulanabilir hale getirmek" mottosuyla hareket etmektedir. Teknik ekiplerden üst düzey yöneticilere kadar geniş bir yelpazedeki profesyoneller için tasarlanmış kapsamlı eğitim programları aracılığıyla, kuruluşların yapay zeka okuryazarlığını artırmaya ve sürdürülebilir bir teknolojik dönüşüm kültürü oluşturmaya öncelik veriyor.

Sıkça Sorulan Sorular

Multimodal AI Uygulamaları Geliştirme Eğitimi | Şükrü Yusuf KAYA