İçeriğe geç
Kavram SözlüğüBilgisayarlı Görü

Görü-Dil Modeli

Görsel ve metinsel bilgiyi ortak temsil veya ortak üretim çerçevesinde birleştiren çok modlu model ailesi.

Görü-dil modelleri, bilgisayarlı görü ile doğal dil işlemenin birleşim noktasını temsil eder. Görsel içerikleri yalnızca sınıflandırmak yerine açıklamak, metinle eşlemek, soru yanıtlamak veya komutlara göre yorumlamak gibi daha genel yetenekler kazandırır. CLIP, Flamingo ve çok modlu LLM ailesi bu alanın öne çıkan örnekleridir. Görsel yapay zekâyı daha esnek, açık uçlu ve kullanıcı dostu hale getiren temel paradigma değişimlerinden biridir.