# Vision: Image Understanding and Analysis

> Source: https://sukruyusufkaya.com/en/learn/claude-ustaligi/vision
> Updated: 2026-05-11T13:48:34.395Z
> Category: Claude Ustalığı
> Module: 7. Claude's Superpowers
**TLDR:** Screenshots, photos, charts, handwritten notes — extracting information from images with Claude vision, plus its limits.

# Vision'la Ne Yaparsın?

- **Ekran görüntüsünden hata mesajı oku.**
- **El yazısı notu yazıya çevir.**
- **Fotoğraflanmış faturadan veri çıkar.**
- **Grafik / chart yorumla.**
- **UI mockup'ı koda çevir.**
- **Kıyafet / yemek / mekan tanıma (yardımcı).**

Gerçek dünyada üretim için en sık 4 senaryo: ekran görüntüsü, belge, fatura, ürün fotoğrafı.

![Vision boru hattı: image upload → vision tokens → analiz](/images/learn/claude-ustaligi/diagram-vision.svg)

_Vision boru hattı._

```python
import anthropic, base64, pathlib
client = anthropic.Anthropic()

img_b64 = base64.standard_b64encode(pathlib.Path("invoice.png").read_bytes()).decode()

resp = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[{
        "role":"user",
        "content":[
            {"type":"image","source":{"type":"base64","media_type":"image/png","data":img_b64}},
            {"type":"text","text":"Bu faturadan toplam tutar, KDV ve fatura numarasını JSON olarak çıkar."},
        ],
    }],
)
print(resp.content[0].text)
```

### Vision prompt'unu nasıl yazmalı?

- Görselden tam olarak ne çıkartmasını istediğini yaz.
- Spesifik alan / koordinat tarif et: "sağ üst köşedeki tarih"
- JSON schema ile struktur ver.
- Zorluk derecesi yüksek görsellerde "emin değilsen 'belirsiz' yaz" diye not düş.

### Birden fazla görsel

Aynı mesajda 5-20 görsel gönderebilirsin (sınır plana bağlı). Karşılaştırma görevlerinde idealdir.

```
Görsel 1: önceki tasarım
Görsel 2: yeni tasarım
Görev: değişiklikleri madde madde listele.
```

### Vision'un sınırları

- Çok düşük çözünürlük → metni okuyamaz.
- Yoğun teknik diyagram → ayrıntı kaçabilir.
- El yazısının kalitesi düşük → tahmin hatası yüksek.
- Hassas kişisel veri (kimlik / pasaport) → işlem öncesi mask gerekebilir.

**Boşluk doldurma egzersizi (text):**
```text
Vision prompt'unda görseldeki spesifik _____ tarif etmek isabeti artırır. JSON _____ ile çıkış formatı kilitlenir. Görsel uzun ise birden fazla _____ gönderilebilir.
```

> ✋ Kontrol noktası: `q-702-mc1`