İçeriğe geç
Tüm roadmap'e dön
topiccore

Belge Anlama (PDF / Tablo)

PDF → structured data. Form, fatura, sözleşme, rapor parse etme.

3 saat1 kaynak1 önkoşul

3 yöntem:

  1. Native PDF input (Claude, Gemini) — sayfayı görsel olarak okur
  2. OCR + LLM — Tesseract/Azure OCR → text → LLM
  3. Layout-aware — Marker, Unstructured, Reducto — tablo/heading/figure yapısı korur

Tablo-ağırlıklı belgelerde 3. yöntem en güvenilir.

Önce bunları bil

Kaynaklar(1)