Reasoning Architecture: <think> Token + Segregated vs Interleaved CoT Decision Matrix
Reasoning models split: (1) **Segregated** — reasoning in <think>...</think> block (DeepSeek-R1, o-series), then final answer; (2) **Interleaved** — reasoning + answer mixed (classic CoT, GPT-4-1106). Each's advantages, FT challenges, user UX. Token budget management.
Şükrü Yusuf KAYA
28 min read
Advanced1. İki Reasoning Paradigması#
Segregated (DeepSeek-R1, OpenAI o-series, Gemini-thinking)#
User: 5 elma + 3 portakal = ? Assistant: <think> Soru basit toplama. Elma ve portakal birim olarak meyve sayısı. 5 + 3 = 8 toplam meyve. </think> Toplam 8 meyve.
Interleaved (Klasik CoT, GPT-4-1106)#
User: 5 elma + 3 portakal = ? Assistant: Önce elmaları sayalım: 5. Sonra portakalları: 3. Toplam: 5 + 3 = 8 meyve.
| Aspect | Segregated | Interleaved |
|---|---|---|
| Final answer hızı | yavaş (think bloğu önce) | erken (akış halinde) |
| UX | "thinking..." göstergesi rahat | streaming chat |
| Token bütçesi | controllable (max_think_tokens) | unbounded |
| Eval kolaylığı | regex `` parse | text scan |
| User reading | rahat (think hidden) | reasoning de görünür |
Cookbook tavsiyesi (2026):
- Math/code domain → Segregated (R1-style, daha kontrol)
- Chat/general → Interleaved (klasik CoT)
✅ Teslim
- R1-Distill model'in output formatını incele. 2) Kendi use-case için segregated mı interleaved mı karar ver. 3) Sonraki ders: 12.2 — Reasoning Trace Dataset Üretimi.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
Related Content
Part 0 — Engineering Foundations
Welcome to the Fine-Tuning Cookbook: System, Stage Taxonomy, and the Reproducibility Contract
Start LearningPart 0 — Engineering Foundations
Reproducibility Stack: Seeds, cuDNN Flags, and Deterministic CUDA — End the 'Works on My Machine' Problem
Start LearningPart 0 — Engineering Foundations