İçeriğe geç

TR Models Reverse Engineering: Trendyol-LLM + Cosmos-LLaMA + KanaryaTR

Türkiye'nin açık TR LLM'leri: Trendyol-LLM (Trendyol e-ticaret odaklı), Cosmos-LLaMA (Cosmos AI Lab), KanaryaTR (Boğaziçi NLP), TURNA, AnatoliaLLM. Her birinin model card okuma, training pipeline reverse-engineering, hangi base + data + technique. Kendin için ne çıkarabilirsin.

Şükrü Yusuf KAYA
30 dakikalık okuma
İleri
TR Models Reverse Engineering: Trendyol-LLM + Cosmos-LLaMA + KanaryaTR

1. TR Açık LLM Ailesi#

ModelGeliştiriciBaseLisansTR-MMLUNotlar
Trendyol-LLM 7BTrendyolLlama 2 7BApache 2.036.5E-ticaret focused, EN+TR mix
Cosmos-LLaMA-7BCosmos AI LabLlama 2 7BMIT38.2TR continual pre-train + SFT
Cosmos-LLaMA-13BCosmos AI LabLlama 2 13BMIT44.1aynı pipeline
KanaryaTR-Llama-3-8BBoğaziçi NLPLlama 3 8BApache 2.041.3academic, continual + SFT
TURNA-1BBoğaziçi NLPscratchApache 2.022.4TR-only pre-train (eski)
AnatoliaLLM-7BHacettepeMistral 7BApache 2.035.2academic
Aya Expanse 8B (TR'de iyi)CoherescratchCC-BY-NC42.3research only
Cookbook'un kuralı (TR commercial): Cosmos-LLaMA-7B/13B veya KanaryaTR baseline; üzerine custom SFT.

2. Trendyol-LLM Reverse-Engineering#

Trendyol model card'tan okunabilen:
  • Base: Llama 2 7B
  • Pre-train extension: 25-50GB TR e-ticaret corpus (Trendyol kataloğu + reviews + customer service)
  • SFT: 100K curated instruction (Trendyol-spesifik task'lar)
  • DPO: 10K user feedback pair (canlı sistemden)
Cookbook'un derslik: Domain-specific TR LLM'leri base + domain-CPT + domain-SFT + DPO ile inşa et.

3. Cosmos-LLaMA Reverse-Engineering#

Cosmos AI Lab GitHub'da pipeline'ı açıkladı:
  1. Base: Llama 2 7B/13B
  2. Continual PT: 30GB TR corpus (Wiki + book + news + forum)
  3. SFT: 50K TR-Alpaca + curated 5K
  4. DPO: 10K AI feedback pair (Llama-3-70B judge)
  5. Eval: TR-MMLU, MT-Bench-TR, custom benchmark
Cookbook için kanıtladığı: Bu cookbook'un yapısı (Part IX + III + XI) Cosmos'un pipeline'ıyla çok yakın. Cosmos'tan farklı: cookbook RTX 4090 baseline, daha kompakt, modern modeller (Llama 3.x, Qwen3).
✅ Teslim
  1. Cosmos-LLaMA-7B model card'ını oku. 2) Kendi domain'in için Cosmos pipeline'ını adapt et. 3) Sonraki ders: 9.7 — TR Embedding & Reranker FT.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

İlgili İçerikler