İçeriğe geç
Tüm roadmap'e dön
topicadvanced

Anthropic Computer Use

Claude ekran görür, mouse/keyboard kontrol eder. GUI otomasyonunun devrimi.

4 saat2 kaynak1 önkoşul

Anthropic Computer Use (Ekim 2024) — Claude'a 4 tool veriliyor: screenshot, click, type, key. Model her step'te:

  1. Screenshot al
  2. UI'yi analiz et (vision)
  3. Sıradaki action'ı seç
  4. Action'ı icra et
  5. Tekrar screenshot — devam

Use case'ler: legacy software automation, form doldurma, screen scraping (API olmayan), end-to-end test, accessibility.

Limitasyonlar: yavaş (her step screenshot + vision), hatalı tıklama riski, anti-bot mekanizmaları (CAPTCHA). Production'da sandbox VM gerek.

Maliyet: vision token'ları pahalı; her screenshot ~1000-2000 token.

Önce bunları bil

Kaynaklar(2)