Reasoning Architecture: \<think\> Token + Segregated vs Interleaved CoT Karar Matrisi
Reasoning model'leri ikiye ayrılır: (1) **Segregated** — \<think\>...\</think\> bloğu (DeepSeek-R1, o-series) içinde reasoning, sonra final answer; (2) **Interleaved** — reasoning + answer karışık (klasik CoT, GPT-4-1106). Her birinin avantajları, FT zorlukları, kullanıcı UX'i. Token bütçesi yönetimi.
Şükrü Yusuf KAYA
28 dakikalık okuma
İleri1. İki Reasoning Paradigması#
Segregated (DeepSeek-R1, OpenAI o-series, Gemini-thinking)#
User: 5 elma + 3 portakal = ? Assistant: <think> Soru basit toplama. Elma ve portakal birim olarak meyve sayısı. 5 + 3 = 8 toplam meyve. </think> Toplam 8 meyve.
Interleaved (Klasik CoT, GPT-4-1106)#
User: 5 elma + 3 portakal = ? Assistant: Önce elmaları sayalım: 5. Sonra portakalları: 3. Toplam: 5 + 3 = 8 meyve.
| Aspect | Segregated | Interleaved |
|---|---|---|
| Final answer hızı | yavaş (think bloğu önce) | erken (akış halinde) |
| UX | "thinking..." göstergesi rahat | streaming chat |
| Token bütçesi | controllable (max_think_tokens) | unbounded |
| Eval kolaylığı | regex `` parse | text scan |
| User reading | rahat (think hidden) | reasoning de görünür |
Cookbook tavsiyesi (2026):
- Math/code domain → Segregated (R1-style, daha kontrol)
- Chat/general → Interleaved (klasik CoT)
✅ Teslim
- R1-Distill model'in output formatını incele. 2) Kendi use-case için segregated mı interleaved mı karar ver. 3) Sonraki ders: 12.2 — Reasoning Trace Dataset Üretimi.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
İlgili İçerikler
Part 0 — Engineering Foundations
Fine-Tuning Cookbook'a Hoş Geldin: Sistematik, Stage Taksonomisi ve Reproducibility Kontratı
Öğrenmeye BaşlaPart 0 — Engineering Foundations
Reproducibility Stack: Seeds, cuDNN Flags ve Deterministic CUDA — 'Sende Niye Çalışıyor Bende Çalışmıyor' Sorununu Bitir
Öğrenmeye BaşlaPart 0 — Engineering Foundations