İçeriğe geç
Tüm roadmap'e dön
topiccore

Vision / Image Input

Görseli prompt'a ekle — OCR, klasifikasyon, scene understanding, UI tasarım eleştirisi.

3 saat1 kaynak

GPT-4o, Claude 4, Gemini 2.x hepsi vision-capable. Pratik: Yüksek çözünürlük → daha fazla token; gereksiz çözünürlüğü düşür.

Pattern:

  • "Bu mockup'ı kod olarak generate et"
  • "Bu fatura PDF'ten 5 alan çıkar: tutar, tarih, satıcı, KDV, fatura no"
  • "Bu UX akışındaki problemleri listele"

Kaynaklar(1)