Belge Analizi: PDF + Tablo + Grafik (Uygulamalı)
Karmaşık PDF'leri (tablo, grafik, formül dahil) yapısal veriye dönüştürme. Multi-page strategy, table extraction.
Şükrü Yusuf KAYA
10 dakikalık okuma
İleriBelge Analizi: Tablo, Grafik, Multi-page
PDF → Görsel → LLM#
python
# pip install pdf2imagefrom pdf2image import convert_from_pathimport base64, io pages = convert_from_path("rapor.pdf", dpi=200) # Her sayfayı LLM'edef page_to_b64(page): buf = io.BytesIO() page.save(buf, format="PNG") return base64.standard_b64encode(buf.getvalue()).decode() content = [{"type": "text", "text": "Bu raporu özetle:"}]for i, p in enumerate(pages): content.insert(0, { "type": "image", "source": {"type": "base64", "media_type": "image/png", "data": page_to_b64(p)} }) content.insert(0, {"type": "text", "text": f"Sayfa {i+1}:"}) # Anthropic max 100 image / istek (yaklaşık)Multi-page PDF → vision LLM
Tablo Çıkarımı#
text
Prompt: "Aşağıdaki görselde bir tablo var. Tabloyu CSV formatına dönüştür. Kurallar:- Header satırını ilk satıra koy- Boş hücreleri 'NA' yap- Sayıları ondalık nokta ile (Türkçe virgül → nokta)- Para birimi sembolünü kaldır, sadece sayı CSV başla:"Tablo extraction prompt
Grafik Yorumlama#
text
Prompt: "Bu görselde bir bar chart var. Şu bilgileri JSON döndür: { 'chart_type': 'bar | line | pie | scatter', 'title': '...', 'x_axis_label': '...', 'y_axis_label': '...', 'data_points': [{'category': '...', 'value': ...}], 'key_insights': ['1-2 cümle ana çıkarım']}"Chart understanding prompt
Strategy: Tek prompt'ta tüm sayfa yerine, bölümlere ayır: page-by-page özet → final synthesis. Daha tutarlı, daha ucuz.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
İlgili İçerikler
1. Temeller — Yapay Zekâ ve LLM'lere Giriş
Bu Eğitim Hakkında ve Verimli Çalışma Yöntemi
Öğrenmeye Başla1. Temeller — Yapay Zekâ ve LLM'lere Giriş
Yapay Zekâ → Üretken AI → LLM: Bağlamsal Harita
Öğrenmeye Başla1. Temeller — Yapay Zekâ ve LLM'lere Giriş