Kavram SözlüğüBilgisayarlı Görü
Görü-Dil Modeli
Görsel ve metinsel bilgiyi ortak temsil veya ortak üretim çerçevesinde birleştiren çok modlu model ailesi.
Görü-dil modelleri, bilgisayarlı görü ile doğal dil işlemenin birleşim noktasını temsil eder. Görsel içerikleri yalnızca sınıflandırmak yerine açıklamak, metinle eşlemek, soru yanıtlamak veya komutlara göre yorumlamak gibi daha genel yetenekler kazandırır. CLIP, Flamingo ve çok modlu LLM ailesi bu alanın öne çıkan örnekleridir. Görsel yapay zekâyı daha esnek, açık uçlu ve kullanıcı dostu hale getiren temel paradigma değişimlerinden biridir.
İlginizi Çekebilir
Yapay zeka yolculuğunuza devam etmek için bu kavramlara da göz atabilirsiniz.
