İçeriğe geç

Reasoning Architecture: \<think\> Token + Segregated vs Interleaved CoT Karar Matrisi

Reasoning model'leri ikiye ayrılır: (1) **Segregated** — \<think\>...\</think\> bloğu (DeepSeek-R1, o-series) içinde reasoning, sonra final answer; (2) **Interleaved** — reasoning + answer karışık (klasik CoT, GPT-4-1106). Her birinin avantajları, FT zorlukları, kullanıcı UX'i. Token bütçesi yönetimi.

Şükrü Yusuf KAYA
28 dakikalık okuma
İleri
Reasoning Architecture: \<think\> Token + Segregated vs Interleaved CoT Karar Matrisi

1. İki Reasoning Paradigması#

Segregated (DeepSeek-R1, OpenAI o-series, Gemini-thinking)#

User: 5 elma + 3 portakal = ? Assistant: <think> Soru basit toplama. Elma ve portakal birim olarak meyve sayısı. 5 + 3 = 8 toplam meyve. </think> Toplam 8 meyve.

Interleaved (Klasik CoT, GPT-4-1106)#

User: 5 elma + 3 portakal = ? Assistant: Önce elmaları sayalım: 5. Sonra portakalları: 3. Toplam: 5 + 3 = 8 meyve.
AspectSegregatedInterleaved
Final answer hızıyavaş (think bloğu önce)erken (akış halinde)
UX"thinking..." göstergesi rahatstreaming chat
Token bütçesicontrollable (max_think_tokens)unbounded
Eval kolaylığıregex `` parsetext scan
User readingrahat (think hidden)reasoning de görünür
Cookbook tavsiyesi (2026):
  • Math/code domain → Segregated (R1-style, daha kontrol)
  • Chat/general → Interleaved (klasik CoT)
✅ Teslim
  1. R1-Distill model'in output formatını incele. 2) Kendi use-case için segregated mı interleaved mı karar ver. 3) Sonraki ders: 12.2 — Reasoning Trace Dataset Üretimi.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

İlgili İçerikler