İçeriğe geç
Tüm roadmap'e dön
topicadvanced

Capability Gating

Agent'ın yapabildiği destructive action'ları kademeli yetkilendir — varsayılan: en az.

2 saat1 önkoşul

Least-privilege agent: her tool'a 3 yetki seviyesi:

  1. Read-only — bilgi alır, dünyayı değiştirmez. Default-allowed.
  2. Write (reversible) — taslak oluştur, e-posta hazırla, file create. Kullanıcı onayı şart (Claude Desktop pattern).
  3. Destructive (irreversible) — dosya sil, e-posta gönder, ödeme yap. Mandatory HITL + double confirmation.

Implementation: her tool'a capability_tier enum + middleware. tier_2/3 action'larda kullanıcıya structured "approve/deny" prompt göster.

Anthropic Computer Use ve Claude Desktop bu pattern'i uyguluyor — destructive tool çağrıldığında modal popup.

Önce bunları bil