# Long Document Summarization and Synthesis

> Source: https://sukruyusufkaya.com/en/learn/claude-ustaligi/uzun-belge-ozetleme
> Updated: 2026-05-11T13:48:34.026Z
> Category: Claude Ustalığı
> Module: 6. Data Analysis and Research
**TLDR:** From 200-page reports to a 1-page brief: map-reduce, anchored summarization, and faithfulness evaluation.

# Uzun Belge ≠ Tek Prompt

Uzun belgelerde 'lost in the middle' problemi gerçektir. Strateji:

- **<200 sayfa:** Tek bağlama sığar; yine de map-reduce daha güvenli.
- **200-1000 sayfa:** Map-reduce zorunlu.
- **1000+ sayfa:** RAG gerekir (Modül 11).

![Map-reduce özet pipeline'ı](/images/learn/claude-ustaligi/diagram-mapreduce.svg)

_Map-reduce özet — parça → mini özet → birleşik özet._

### Anchored summarization

Özetin **iddiaları kaynak alıntıyla anchorlı** olmasını iste:

```
{
  "summary": "...",
  "claims": [
    {"text":"...", "source_quote":"...", "page": 42}
  ]
}
```

Sahtelendirilmiş iddiaları tutmak çok daha zor olur.

### Faithfulness eval

Üretilen özetteki her iddiayı kaynaktan doğrulayan ikinci Claude çağrısı koş:

```
"Bu özet ifadesi şu metinden destekleniyor mu?
Cevap: 'destekli', 'kısmen', 'desteksiz'."
```

Desteksiz iddialar pipeline'dan otomatik düşer.

### Hedef personaya göre özet

Aynı belge için 3 farklı özet:

- CEO için 1 sayfa, kararlar
- Mühendis için 2 sayfa, teknik detaylar
- Müşteri için 1 paragraf, faydalar

Pipeline'da 'final paraphrase' adımına persona ekle.

```python
# Map-reduce özet iskeleti
def chunk_text(text: str, max_chars: int = 25_000):
    for i in range(0, len(text), max_chars):
        yield text[i:i+max_chars]

def map_summary(chunk: str) -> str:
    """Tek parça için 200 kelimelik mini özet — Claude çağrısı (psödo)"""
    ...

def reduce_summary(mini_summaries: list[str]) -> str:
    """Tüm mini özetleri birleştir — başka bir Claude çağrısı"""
    ...

def summarize_long(text: str) -> str:
    minis = [map_summary(c) for c in chunk_text(text)]
    return reduce_summary(minis)
```

**Boşluk doldurma egzersizi (text):**
```text
Uzun belgelerde _____ in the middle problemi nedeniyle map-reduce kullanılır. İddiaların kaynak alıntıyla bağlandığı yaklaşıma _____ summarization denir. Sahteliği kontrol için _____ eval koşulur.
```

> ✋ Kontrol noktası: `q-603-mc1`