Skip to content

Belge Analizi: PDF + Tablo + Grafik (Uygulamalı)

Karmaşık PDF'leri (tablo, grafik, formül dahil) yapısal veriye dönüştürme. Multi-page strategy, table extraction.

Şükrü Yusuf KAYA
10 min read
Advanced

Belge Analizi: Tablo, Grafik, Multi-page

PDF → Görsel → LLM#

python
# pip install pdf2image
from pdf2image import convert_from_path
import base64, io
 
pages = convert_from_path("rapor.pdf", dpi=200)
 
# Her sayfayı LLM'e
def page_to_b64(page):
buf = io.BytesIO()
page.save(buf, format="PNG")
return base64.standard_b64encode(buf.getvalue()).decode()
 
content = [{"type": "text", "text": "Bu raporu özetle:"}]
for i, p in enumerate(pages):
content.insert(0, {
"type": "image",
"source": {"type": "base64", "media_type": "image/png", "data": page_to_b64(p)}
})
content.insert(0, {"type": "text", "text": f"Sayfa {i+1}:"})
 
# Anthropic max 100 image / istek (yaklaşık)
Multi-page PDF → vision LLM

Tablo Çıkarımı#

text
Prompt:
 
"Aşağıdaki görselde bir tablo var. Tabloyu CSV formatına dönüştür.
 
Kurallar:
- Header satırını ilk satıra koy
- Boş hücreleri 'NA' yap
- Sayıları ondalık nokta ile (Türkçe virgül → nokta)
- Para birimi sembolünü kaldır, sadece sayı
 
CSV başla:"
Tablo extraction prompt

Grafik Yorumlama#

text
Prompt:
 
"Bu görselde bir bar chart var. Şu bilgileri JSON döndür:
 
{
'chart_type': 'bar | line | pie | scatter',
'title': '...',
'x_axis_label': '...',
'y_axis_label': '...',
'data_points': [{'category': '...', 'value': ...}],
'key_insights': ['1-2 cümle ana çıkarım']
}"
Chart understanding prompt
Strategy: Tek prompt'ta tüm sayfa yerine, bölümlere ayır: page-by-page özet → final synthesis. Daha tutarlı, daha ucuz.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

Related Content