Belge Analizi: PDF + Tablo + Grafik (Uygulamalı)

Karmaşık PDF'leri (tablo, grafik, formül dahil) yapısal veriye dönüştürme. Multi-page strategy, table extraction.

Şükrü Yusuf KAYA

10 dakikalık okuma

22.06.2026

İleri

Belge Analizi: Tablo, Grafik, Multi-page#

PDF → Görsel → LLM#

python

# pip install pdf2image
from pdf2image import convert_from_path
import base64, io
 
pages = convert_from_path("rapor.pdf", dpi=200)
 
# Her sayfayı LLM'e
def page_to_b64(page):
    buf = io.BytesIO()
    page.save(buf, format="PNG")
    return base64.standard_b64encode(buf.getvalue()).decode()
 
content = [{"type": "text", "text": "Bu raporu özetle:"}]
for i, p in enumerate(pages):
    content.insert(0, {
        "type": "image",
        "source": {"type": "base64", "media_type": "image/png", "data": page_to_b64(p)}
    })
    content.insert(0, {"type": "text", "text": f"Sayfa {i+1}:"})
 
# Anthropic max 100 image / istek (yaklaşık)

Multi-page PDF → vision LLM

Tablo Çıkarımı#

text

Prompt:
 
"Aşağıdaki görselde bir tablo var. Tabloyu CSV formatına dönüştür.
 
Kurallar:
- Header satırını ilk satıra koy
- Boş hücreleri 'NA' yap
- Sayıları ondalık nokta ile (Türkçe virgül → nokta)
- Para birimi sembolünü kaldır, sadece sayı
 
CSV başla:"

Tablo extraction prompt

Grafik Yorumlama#

text

Prompt:
 
"Bu görselde bir bar chart var. Şu bilgileri JSON döndür:
 
{
  'chart_type': 'bar | line | pie | scatter',
  'title': '...',
  'x_axis_label': '...',
  'y_axis_label': '...',
  'data_points': [{'category': '...', 'value': ...}],
  'key_insights': ['1-2 cümle ana çıkarım']
}"

Chart understanding prompt

Strategy: Tek prompt'ta tüm sayfa yerine, bölümlere ayır: page-by-page özet → final synthesis. Daha tutarlı, daha ucuz.

Yorumlar & Soru-Cevap

(0)

Yorum yazmak için giriş yap.

Yorumlar yükleniyor...

İlgili İçerikler

1. Temeller — Yapay Zekâ ve LLM'lere Giriş