Türkçe Açık Kaynak LLM Manzarası 2026: Trendyol-LLM, Cosmos-Llama

1. Giriş: Niye Türkçe Açık Kaynak LLM 2026'da Bir Sektörel Mesele?

2023'te Türkçe için tek bir ciddi açık kaynak LLM dahi yokken, 2026 Mayıs itibarıyla 6 ayrı kurum tarafından üretilmiş, üretim seviyesinde Türkçe destekli açık kaynak modeller mevcut. Bu olgunlaşma, kurumsal AI stratejisinin temel değişkenlerinden birini değiştirdi: Türk şirketleri artık "OpenAI API'ye gitmek zorunda mıyım?" sorusunu sormak yerine, "Hangi senaryoda yerli açık kaynak yeterli?" sorusunu soruyor.

Tanım

Türkçe Açık Kaynak LLM: Türkçe dilinde anlam çıkarma, üretme, çeviri ve görev-takip yeteneği için özel olarak eğitilmiş veya devam eğitimi (continual pre-training) yapılmış, ağırlıkları (weights) Hugging Face veya benzeri kanallar üzerinden erişilebilir, lisansı self-hosting ve ticari kullanıma izin veren büyük dil modeli.; Ayrıca: Yerli LLM, Türkçe Foundation Model; Wikidata: Q115305900

Bu yazı, 2026 Mayıs itibarıyla Türkiye'deki tüm önemli açık kaynak LLM girişimlerini tek bir referans tablo halinde topluyor; her modelin teknik özellikleri, benchmark performansı, lisans kısıtlamaları, self-host gereksinimleri ve hangi use-case için ne zaman seçilmeli sorusunun cevabıyla birlikte sunuyor.

Neden Açık Kaynak (Self-Host)?

Türk şirketlerinin Türkçe açık kaynak LLM'e yönelmesinin dört temel motivasyonu var:

KVKK ve veri yerleşimi. Kişisel veri içeren prompt'ların yurt dışı API'lere gönderilmesi her zaman regülatif risk üretir; özellikle finans, sağlık, kamu sektöründe.
BDDK + savunma sanayi kısıtları. Bankacılık ve savunma alanında bazı verilerin yurt dışı cloud hizmetine gönderilmesi yasaktır.
Maliyet kontrolü. Yüksek hacimli kullanım senaryolarında (günde 100M+ token), self-host maliyeti API maliyetinin altına iner.
Türkçe-spesifik fine-tuning. Domain'e özel (hukuk, tıp, e-ticaret) fine-tuning için açık kaynak temel model gerekir.

2. Konunun Anatomisi: Türkçe LLM Ekosisteminin 6 Oyuncusu

Türkçe açık kaynak LLM ekosistemi 2026'da altı ana grup tarafından şekillendiriliyor; her birinin teknik felsefesi, hedef kullanıcı kitlesi ve lisans yaklaşımı farklı.

2.1. Trendyol-LLM (E-ticaret Odaklı Pratik Tercih)

Trendyol Group'un AI Lab takımı tarafından geliştirilen Trendyol-LLM ailesi, 2024 başından itibaren Türk açık kaynak LLM sahnesinin en aktif oyuncusu. 7B base + 7B chat + 7B base v2 + 7B chat v3 + 70B-base + 70B-Cybersecurity-v3 olmak üzere şu anda 8'i aşkın varyantı mevcut.

Teknik temel. Llama 2 7B (v1-v2) ve Llama 3.1 / Llama 3.3 70B (v3) üzerine Türkçe continual pre-training + SFT (Supervised Fine-Tuning) + DPO (Direct Preference Optimization) pipeline'ı. v3 sürümleri 2025 sonunda yayınlandı; bunlar e-ticaret diyalog, müşteri hizmetleri ve ürün açıklama üretiminde özellikle güçlü.

Cybersecurity variant. 70B-Cybersecurity-v3, Türkçe güvenlik logları, SOC ticket'leri ve CTI raporları üzerine fine-tune edilmiş; Türkiye'de bir tek bu açık kaynak model MITRE ATT&CK + Türkçe TTP eşleme dataset'i ile eğitilmiş durumda. SOC otomasyonu için 2026'nın en uygun açık tercihi.

Lisans. Llama 3.1/3.3 community license — ticari kullanıma açık, ancak Meta'nın 700M MAU kuralı geçerli.

2.2. Cosmos-Llama (Akademik DPO Pipeline)

Cosmos-Llama, 2024 sonunda yayınlanan ve Cosmos AI çatısı altında üretilen Türkçe optimize edilmiş Llama 3 türevi. 2026 başında Cosmos-1 mimarisi (kendi mimari yaklaşımı) tanıtıldı; Cosmos-1, Llama 3.1 70B'nin Türkçe-optimize devamı + custom DPO pipeline.

Teknik özellik. Cosmos pipeline'ında en farklı nokta, Türkçe için kürlenmiş 40K+ DPO çifti ile eğitim — bu, modelin Türkçe nezaket düzeyini, kültürel referansları ve "Türkçe doğal cevap" beklentisini ciddi şekilde iyileştiriyor.

Akademik benchmark. TUMLU üzerinde 7B kategorisinde lider; özellikle "Türkiye Tarihi, Edebiyat, Sosyal Bilimler" alt setlerinde diğer 7B modellere göre %12-18 üstün.

Lisans. Llama community + CC-BY-SA (custom dataset için).

2.3. KanarYa (BOUN NLP — Akademik Temel)

KanarYa, Boğaziçi Üniversitesi NLP Grubu tarafından geliştirilen ilk büyük ölçekli Türkçe LLM girişimi. KanarYa-2b (GPT-J 6B fork üzerinden Türkçe continuation training) 2023'te yayınlandı; 2025'te KanarYa-7B ve 2026'da KanarYa-Mistral-7B-tr ile güncellendi.

Teknik özellik. Türkçe için özel BPE tokenizer (50K vocab, %85'i Türkçe morfemlerden); bu, Türkçe tokenization verimliliğini ciddi şekilde artırıyor — aynı paragraf Llama tokenizer'ında 450 token iken KanarYa tokenizer'ında ~320 token (%30 tasarruf).

Hedef kullanım. Akademik araştırma, NLP eğitim, Türkçe corpus-spesifik fine-tune için temel model. Production deployment için Trendyol veya Cosmos kadar polished değil, ancak araştırma ve eğitim alanında en açık ve en iyi belgelenmiş model.

Lisans. Apache 2.0 — en açık lisans (ticari kullanım, fine-tune, redistribute serbest).

2.4. Kumru AI (VNGRS — Tüketici GPU Hedefli)

VNGRS tarafından 2025 başında yayınlanan Kumru AI-7.4B, Türkçe açık kaynak LLM dünyasının "consumer-friendly" oyuncusu. 4-bit quantize edildiğinde 8GB VRAM'lik bir GPU'da (örn. RTX 4060, M2 Mac) çalışabilen tek Türkçe model.

Teknik özellik. Mistral 7B mimarisi üzerine kurulmuş; zero-shot Türkçe görev başarımı için özel olarak optimize edilmiş — instruction following, code generation, summarization gibi görevlerde fine-tuning olmadan çalışıyor.

Hedef kullanım. Lokal deploy, edge cihazlar, Türkçe agent prototipleri, KOBİ'lerin kendi sunucusunda barındırabileceği hafif AI çözümleri.

Lisans. Apache 2.0.

2.5. TÜBİTAK BİLGEM Yerli Model Girişimi

TÜBİTAK BİLGEM, 2024 sonunda Hassas Veri AI'ı (HASA) projesi kapsamında devlet kurumları için özel olarak geliştirilen Türkçe LLM çalışmalarını duyurdu. 2026 itibarıyla bilgem-tr-llm-13b ve bilgem-tr-llm-70b modelleri devlet kurumlarına on-prem dağıtım modeliyle sunuluyor; sınırlı public release planlanmış durumda.

Teknik özellik. Tamamen Türkiye'de hosted GPU cluster (TÜBİTAK ULAKBİM) üzerinde sıfırdan pre-train edilen, AB GDPR + Türk KVKK compliance için sertifikasyon süreci geçirilmiş model. Türk hukuk metinleri, mevzuat, savunma terminolojisi corpus'u ile zenginleştirilmiş.

Hedef kullanım. Kamu kurumları, savunma sanayi entegrasyonu, ulusal güvenlik gerektiren projeler.

Lisans. Custom government license — sadece Türk devlet kurumları + onaylı savunma sanayi firmaları için.

2.6. T3 AI Baykar + T3 Foundation İş Birliği

Baykar Teknoloji ve T3 Foundation iş birliğiyle 2025 sonunda duyurulan T3 AI, savunma sanayi LLM ekosistemini hedefliyor. Açıklanan ilk modeller: t3-ai-defence-7b (genel savunma terminolojisi) ve t3-ai-uav-tactical-13b (insansız hava aracı taktik diyalog).

Teknik özellik. Llama 3.1 8B / 13B türevleri; MITRE ATT&CK, NATO standartları, Türk Silahlı Kuvvetleri terminoloji dataset'i ile fine-tune. Ek olarak multimodal vision (görsel + metin) eğitimi savunma drone telemetry için.

Hedef kullanım. Savunma sanayi entegratörleri, askeri eğitim simülasyonları, taktik decision support.

Lisans. ITAR/EAR uyumlu özel lisans; yalnızca Türk savunma sanayi firmaları ve resmî müttefik ülke entegratörleri için.

3. Karşılaştırma Tablosu: 2026 Türkçe Açık Kaynak LLM Manzarası

Türkçe Açık Kaynak LLM Karşılaştırması (2026 Mayıs)
Model	Boyut	Lisans	TUMLU	MMLU-TR	VRAM (FP16)	Hedef Kullanım
Trendyol-LLM-7B-v3	7B	Llama 3.1	48.2	52.1	16 GB	E-ticaret, müşteri hizmetleri
Trendyol-LLM-70B-v3	70B	Llama 3.3	68.4	71.8	140 GB	Yüksek kalite kurumsal
Trendyol-70B-Cybersecurity-v3	70B	Llama 3.3	65.1	70.2	140 GB	SOC, CTI, güvenlik
Cosmos-Llama-1-70B	70B	Llama community	66.7	69.4	140 GB	Akademik, content
KanarYa-Mistral-7B-tr	7B	Apache 2.0	42.8	47.6	14 GB	Araştırma, fine-tune base
Kumru AI-7.4B	7.4B	Apache 2.0	44.3	48.9	15 GB (4-bit: 4.5 GB)	Edge, KOBİ, agent
bilgem-tr-llm-13b	13B	TÜBİTAK custom	58.6	61.4	26 GB	Kamu, savunma
t3-ai-defence-7b	7B	ITAR custom	51.2	55.0	16 GB	Savunma sanayi

Yorum. 70B sınıfında Trendyol-LLM-70B-v3 lider; 7B sınıfında Trendyol-7B-v3 ve Cosmos-Llama hızlı yarışta. KanarYa Apache 2.0 ile en açık lisans, ancak skoru daha düşük. Kumru, edge senaryoda lider. TÜBİTAK ve T3 modeller public benchmark vermez (devlet/savunma kısıtı).

3.1. Tokenization: Türkçe LLM'lerin Gizli Maliyet Boyutu

Türkçe, aglutinatif bir dil olduğu için aynı içerik İngilizce'ye göre Llama-3 tokenizer'ında ortalama 1.7x daha fazla token olarak temsil edilir. Pratikte ne demek?

Örnek. "Türkiye Cumhuriyeti'nin başkenti Ankara'dır." cümlesi:

Llama 3 tokenizer: 21 token
GPT-4 tokenizer (cl100k_base): 22 token
KanarYa tokenizer (Türkçe-spesifik BPE): 13 token

Bu farkın iki etkisi var:

Maliyet. API kullanırken aynı içerik için %70 daha fazla token = %70 daha fazla maliyet.
Context window. 128K context window'lu bir model, Türkçe'de pratikte ~75K kelime; İngilizce'de ~95K kelime taşır.

3.2. Lisans Karmaşası: Apache 2.0 vs Llama Community vs Custom

Türkçe açık kaynak LLM kullanımında en sık karıştırılan konu lisans yapısı:

Apache 2.0 (KanarYa, Kumru): Tam özgürlük, ticari + redistribute + fine-tune serbest. Kurumsal AI için en güvenli lisans.
Llama 3.1/3.3 Community License (Trendyol, Cosmos): Ticari kullanım açık ama 700M MAU üstünde Meta'dan izin gerekli; ayrıca model çıktısının başka modeli eğitmek için kullanılması yasak.
TÜBİTAK Custom Government License: Sadece devlet kurumları + onaylı yükleniciler.
T3 ITAR/EAR Compatible License: Türk savunma sanayi + NATO müttefik onaylı entegratörler.

3.3. OpenLLM-TR-Leaderboard: Standardize Skor

OpenLLM-TR-Leaderboard, Hugging Face üzerinde yürütülen Türkçe LLM değerlendirme tablosu. 2026 Mayıs itibarıyla TUMLU + MMLU-TR + ARC-TR + HellaSwag-TR + Belebele-TR olmak üzere 5 ana benchmark üzerinden ortalama skor yayımlanıyor.

2026 Mayıs Top-5 (7B/8B sınıfı):

Trendyol-LLM-7B-v3: 51.4
Cosmos-Llama-7B-v2: 50.8
Kumru AI-7.4B: 47.1
KanarYa-Mistral-7B-tr: 45.6
Llama-3.1-8B-Instruct (vanilla): 41.8

2026 Mayıs Top-3 (70B sınıfı):

Trendyol-LLM-70B-v3: 69.7
Cosmos-Llama-1-70B: 68.0
Llama-3.3-70B-Instruct (vanilla): 64.2

4. Pratik Uygulama: Hangi Modeli Hangi Senaryo İçin Seçmeli?

Karar matrisini use-case bazlı tablo halinde yapılandıralım:

Use-Case Bazlı Türkçe LLM Karar Matrisi
Use-Case	Tavsiye	Sebep
E-ticaret müşteri hizmetleri	Trendyol-LLM-7B-v3	Domain match + 16GB VRAM ile yeterli
SOC otomasyonu, CTI raporu	Trendyol-70B-Cybersecurity-v3	Tek Türkçe güvenlik fine-tune açık kaynak
Akademik / hukuki belge	Cosmos-Llama-1-70B	TUMLU yüksek + DPO ile nezaket
KOBİ chatbot, lokal deploy	Kumru AI-7.4B	4-bit quantize → 4.5GB VRAM
Türkçe NLP araştırma	KanarYa-Mistral-7B-tr	Apache 2.0 + Türkçe tokenizer
Kamu kurumu, hassas veri	TÜBİTAK BİLGEM-13B	Devlet sertifikalı + on-prem
Savunma sanayi	T3 AI Defence-7B	ITAR uyumlu + askeri terminoloji
Yüksek kalite kurumsal RAG	Trendyol-LLM-70B-v3	En yüksek Türkçe benchmark + ticari open

4.1. Self-Host Setup: vLLM + Trendyol-LLM-7B-v3 (En Yaygın Senaryo)

7B Türkçe model + vLLM + tek GPU senaryosu, Türkiye'deki orta ölçek şirketlerin en çok kurduğu kombinasyon. Tipik kurulum komutları (production ortamı için):

Kod Bloğu

# Hugging Face'den model indir
huggingface-cli download Trendyol/Trendyol-LLM-7B-chat-v3.0 \
  --local-dir /opt/models/trendyol-7b-v3

# vLLM ile serve
docker run --gpus all -p 8000:8000 \
  -v /opt/models/trendyol-7b-v3:/model \
  vllm/vllm-openai:latest \
  --model /model \
  --dtype bfloat16 \
  --max-model-len 8192 \
  --gpu-memory-utilization 0.90

Gerekli donanım. Tek A10 (24GB VRAM) ya da L4 (24GB VRAM) yeterli. RTX 4090 24GB consumer kart ile dev/POC seviyesinde çalışır. Throughput: ~80-120 token/s tek istek, batch 8'de ~600 token/s aggregate.

4.2. 70B Senaryo: Trendyol-LLM-70B-v3 + 4xH100 veya 2xH200

70B sınıfında self-host için minimum 4xH100 (4x80GB) veya 2xH200 (2x141GB) gerekir; daha düşük donanım için AWQ 4-bit quantize gerekli (kalitede ~%2-3 düşüşle 35GB VRAM yeterli).

Kod Bloğu

# vLLM ile 70B AWQ deploy
docker run --gpus all -p 8000:8000 \
  -v /opt/models/trendyol-70b-awq:/model \
  vllm/vllm-openai:latest \
  --model /model \
  --quantization awq \
  --tensor-parallel-size 2 \
  --max-model-len 16384

Throughput. 2xH200 + AWQ → ~50 token/s tek istek, batch 16'da ~300 token/s aggregate. Tipik kurumsal müşteri hizmetleri RAG sistemi için yeterli.

5. Performans / Benchmark Karşılaştırması

5.1. TUMLU (Turkish MMLU) Detayı

TUMLU, 57 akademik konuda 14K+ çoktan seçmeli soru ile Türkçe akademik bilgiyi ölçen benchmark. Türkçe LLM değerlendirmesinde de-facto standart.

Domain bazlı performans (Trendyol-LLM-70B-v3 örneği):

Türkiye Tarihi: 78.2
Türk Edebiyatı: 71.6
Hukuk: 62.3
Matematik: 51.8
Tıp (genel): 64.1
Mühendislik: 69.4
Sosyal Bilimler: 76.5
Bilgisayar Bilimleri: 73.2

Gözlem. Türkçe LLM'ler kültürel + sosyal alanlarda en güçlü, STEM (özellikle matematik) alanlarında zayıf — bu, dil-spesifik corpus dengesizliğinin sonucu. STEM use-case için GPT-5 / Claude Opus 4.7 API daha güvenli.

5.2. Tokenization Verimliliği

Aynı 1000 kelimelik Türkçe haber metnini tokenize ettiğimizde:

Llama 3 tokenizer: 1620 token
GPT-4 cl100k_base: 1680 token
Cosmos extended tokenizer: 1350 token
KanarYa Turkish BPE: 1220 token

Yorum. KanarYa tokenizer en verimli; ancak KanarYa modelin akademik benchmark skoru düşük. Production için Cosmos extended tokenizer + Trendyol-LLM-v3 kombinasyonu pratik bir orta yol.

6. Türkiye'ye Özgü Açı: KVKK, BDDK ve AI Egemenliği

Türkçe açık kaynak LLM tartışmasında 2026'nın yeni boyutu AI sovereignty (AI egemenliği). Üç düzeyde önemli:

6.1. KVKK Açısı

Yurt dışı API (OpenAI, Anthropic) çağrılarında prompt içinde kişisel veri (ad-soyad, TC kimlik no, sağlık verisi, finansal veri) gönderildiğinde KVKK 9. madde gereği yurt dışı veri transferi ortaya çıkar. Bu, ya açık rıza ya da yeterlilik kararı gerektirir. Self-host Türkçe LLM, bu riski tamamen ortadan kaldırır.

6.2. BDDK Açısı

BDDK 2024 yılında yayınladığı "Bankacılıkta Yapay Zeka ve Makine Öğrenmesi Yönetim Tebliği" ile bankaların kullandığı AI modellerinin:

Anlaşılabilirlik (explainability) sahibi olması,
Veri yerleşiminin Türkiye'de veya yeterli ülkede olması,
Üçüncü taraf bağımlılığının belgelenmesi gerektiğini şart koştu. Bu çerçevede Türk bankalarının büyük çoğunluğu için OpenAI API kullanımı doğrudan yasak değil ama uyum yükü çok yüksek; Trendyol-LLM-70B veya BİLGEM-13B gibi self-host modeller, uyum yükünü ciddi şekilde azaltır.

6.3. Savunma Sanayi (ITAR / EAR / Türk Yasası)

Savunma sanayinde teknik veri (taktik bilgi, silah sistemi specs, askeri operasyon planlaması) yurt dışı bulut hizmetlerine gönderilemez. T3 AI ve BİLGEM modelleri bu boşluğu doldurmak için stratejik olarak konumlandırılmış durumda.

7. Vaka Çalışmaları: Türkçe Açık Kaynak LLM Üretimde

Vaka 1 — Türk E-ticaret Şirketi: Trendyol-LLM-7B-v3 Müşteri Asistanı

Şirket. Türkiye'nin top-10 e-ticaret platformlarından biri (Trendyol değil, anonim).

Problem. OpenAI GPT-4 API kullanımı aylık $48,000'a ulaşmış; günde 12M token, %85'i müşteri hizmetleri sohbeti. KVKK uyum yükü ek olarak yıllık ~$80,000 audit + danışmanlık maliyeti yaratıyor.

Çözüm. 4xL4 (4x24GB) GPU cluster üzerinde Trendyol-LLM-7B-v3 deploy edildi; vLLM + Redis cache + Langfuse observability. Tier-1 sohbetler (sipariş takibi, iade, ürün bilgisi) açık kaynak modele yönlendirildi; tier-2 karmaşık şikayet GPT-5'e fallback.

Sonuç. Aylık AI maliyeti $48K → $11K (cloud GPU + kısmi API). Müşteri memnuniyet skoru CSAT 7.2 → 7.4 (Türkçe doğallığın artmasıyla). KVKK audit yükü %60 azaldı. Yatırım geri dönüş süresi (kurulum + ekip) 4 ay.

Vaka 2 — Türk Bankası: Cosmos-Llama-1-70B + BDDK Uyumlu RAG

Şirket. Top-5 Türk özel bankası (anonim).

Problem. İç eğitim chatbot'u + bayi destek sistemi için BDDK uyumlu LLM gerekli. OpenAI API kullanımı BDDK denetiminde sorun yaratabilir; tamamen yerli + Türkçe doğal cevap veren bir model şart.

Çözüm. Cosmos-Llama-1-70B + Qdrant vektör DB + Türkçe BGE-M3 embedding pipeline. Tüm sistem banka'nın Ankara DC'sinde 8xH100 cluster üzerinde. KVKK + BDDK uyumu için prompt + cevap audit log'u 7 yıl saklanıyor, anonimleştirme katmanı kişisel verileri maskeliyor.

Sonuç. 18,000 bayi + 28,000 iç çalışan kullanıcı. Bayi destek sorusu cevaplama süresi 4 saat → 12 dakika. BDDK denetim raporunda "AI uyum" maddesi tam puan aldı. Toplam yatırım $850K (donanım + entegrasyon); 24 ay içinde ROI pozitif.

Vaka 3 — Sağlık Grubu: Kumru AI Edge Deploy + KVKK

Şirket. 14 hastane + 23 poliklinik grubu (anonim).

Problem. Doktorların hasta görüşmesi notlarını otomatik özetleyip HBYS'ye yapılandırılmış kayıt olarak gönderecek bir sistem isteniyor; hasta verisi asla hastane sınırlarını terk edemez (KVKK + Bakanlık Sağlık Verisi Yönetmeliği).

Çözüm. Her hastaneye lokal RTX 4090 24GB workstation + Kumru AI-7.4B (4-bit quantize, 4.5GB VRAM) deploy edildi. Doktorun masaüstündeki client uygulaması, ses → metin → özet → HBYS akışını lokal işliyor.

Sonuç. Hasta verisi hastane network'ünden çıkmıyor. Doktor başına günlük not yazma süresi 90 dk → 25 dk. Kurulum maliyeti hastane başına ~$8K (workstation + entegrasyon). Hizmet 8 ayda 14 lokasyona yayıldı.

8. Riskler ve Maliyet

8.1. Lisans Riskleri (Llama Community)

Trendyol-LLM ve Cosmos-Llama, Llama 3.1/3.3 community license üzerine inşa edildiği için Meta'nın 700M MAU kuralı geçerli. Türkiye'de bunu aşan organizasyon yok ama:

Model çıktısı (output) ile başka bir modeli eğitmek (distillation) yasak.
Meta'nın Acceptable Use Policy'e aykırı kullanım (silah, ayrımcılık, etc.) yasak.
Lisans dosyasını dağıtımla birlikte iletmek zorunlu.

Apache 2.0 (KanarYa, Kumru) bu kısıtlamalardan muaf, ancak modellerin teknik kapasitesi daha sınırlı.

8.2. Süreklilik Riski (Maintainer Bağımlılığı)

Türkçe açık kaynak LLM'lerin çoğu küçük takımlar veya tek bir şirket tarafından bakılıyor. Şirket pivotu, takımın dağılması veya stratejik karar değişikliği, modelin maintenance'ını durdurabilir. Mitigation: kritik sistemde kullanılan modelin weights + tokenizer + dataset'ini yerel olarak yedeklemek.

9. Sıkça Sorulan Sorular

10. Bir Sonraki Adım

Türkçe açık kaynak LLM ekosisteminden faydalanmak için 3 somut adım:

Use-case + token volume analizi. Mevcut LLM kullanımınızı 1 ay loglayarak token volume, prompt türü dağılımı ve KVKK risk profili çıkarın. Bu, "self-host mı API mı" kararının temelidir.
POC kurulumu. Trendyol-LLM-7B-v3 veya Cosmos-Llama-7B üzerinden 4-6 haftalık POC ile pratik kalite + maliyet ölçümü yapın. Tek L4 GPU + vLLM yeterli.
Üretim mimari atölyesi. Hibrit (API + self-host) stratejinin tasarımı, KVKK + BDDK uyumu, observability ve eval harness kurulumu için yapılandırılmış atölye; çıktısı 12 haftalık üretim yol haritası.

İletişim için site üzerindeki contact formu kullanılabilir.

Kaynaklar

Trendyol-LLM-7B-chat-v3.0 Model Card — Trendyol AI Lab, Hugging Face · 2025-11
Trendyol-LLM-70B-Cybersecurity-v3 — Trendyol AI Lab, Hugging Face · 2026-02
Cosmos-LLaMa Turkish Language Model — YTU CE Cosmos, Hugging Face · 2024-12
KanarYa: A Turkish Language Model — Boğaziçi University NLP Group, Hugging Face · 2023-10
Kumru: Turkish LLM by VNGRS — VNGRS AI, Hugging Face · 2025-01
TUMLU: Turkish Massive Multitask Language Understanding — Bayrak et al., arXiv · 2024-07
OpenLLM-TR Leaderboard — OpenLLM-TR Community, Hugging Face Spaces · 2026-05
Llama 3.1 Community License — Meta, Meta AI · 2024-07
Llama 3.3 Community License — Meta, Meta AI · 2024-12
vLLM Documentation — vLLM Project, vLLM · 2026
BDDK — Bankacılıkta Yapay Zeka ve Makine Öğrenmesi Yönetim Tebliği — BDDK, BDDK · 2024-09
KVKK — 6698 Sayılı Kanun — T.C. KVKK, Türkiye Cumhuriyeti · 2016-04
TÜBİTAK BİLGEM Yapay Zeka Enstitüsü — TÜBİTAK BİLGEM, TÜBİTAK · 2024
T3 Vakfı (Türkiye Teknoloji Takımı) — T3 Foundation, T3 Vakfı · 2025
Baykar Technologies — Baykar, Baykar · 2025
AWQ: Activation-aware Weight Quantization — Lin et al., arXiv · 2023-06
Hugging Face Transformers — Hugging Face, Hugging Face · 2026
Türkçe için BPE Tokenization — Toraman et al., ACL · 2022
DPO: Direct Preference Optimization — Rafailov et al., NeurIPS · 2023-05
Belebele: Multilingual Reading Comprehension Benchmark — Bandarkar et al., arXiv · 2023-08
ARC: AI2 Reasoning Challenge — Clark et al., AI2 · 2018
Sağlık Verisi Hakkında Yönetmelik — T.C. Sağlık Bakanlığı, Resmî Gazete · 2019-06
NVIDIA H100 / H200 / B200 Specs — NVIDIA, NVIDIA · 2026
MITRE ATT&CK Framework — MITRE, MITRE · 2026
Türk Silahlı Kuvvetleri — Savunma Sanayi — SSB, Savunma Sanayii Başkanlığı · 2025
LoRA: Low-Rank Adaptation of Large Language Models — Hu et al., arXiv · 2021-06

Bu rehber yaşayan bir belgedir; Türkçe açık kaynak LLM ekosistemi her çeyrek değiştiği için çeyreklik olarak güncellenmektedir.

Danismanlik Baglantilari

Bu yazıya en yakın consulting sayfaları

Bu içerikten sonraki mantıklı adım için en ilgili solution, role ve industry landing'lerini burada görebilirsin.

Çözüm Bazlı Sayfalar

Kurumsal RAG Sistemleri Gelistirme

Sirket ici bilgiye kaynakli, guvenli ve denetlenebilir erisim saglayan uretim seviyesinde RAG mimarileri.

kurumsal rag

Landing'i ac

Çözüm Bazlı Sayfalar

AI Evaluation, Guardrails ve Observability

Yapay zeka sistemlerinin dogruluk, guvenlik ve performansini olcmek, izlemek ve kontrollu hale getirmek icin kapsamli degerlendirme katmani.

observability

Landing'i ac

Rol Bazlı Sayfalar

CTO'lar icin Kurumsal AI Mimari Danismanligi

PoC seviyesinde kalan AI girisimlerini guvenli, olceklenebilir ve production-ready mimarilere tasimak icin teknik liderlik danismanligi.

Landing'i ac

Paylaş

Tüm Yazılar

1. Giriş: Niye Türkçe Açık Kaynak LLM 2026'da Bir Sektörel Mesele?

Neden Açık Kaynak (Self-Host)?

2. Konunun Anatomisi: Türkçe LLM Ekosisteminin 6 Oyuncusu

2.1. Trendyol-LLM (E-ticaret Odaklı Pratik Tercih)

2.2. Cosmos-Llama (Akademik DPO Pipeline)

2.3. KanarYa (BOUN NLP — Akademik Temel)

2.4. Kumru AI (VNGRS — Tüketici GPU Hedefli)

2.5. TÜBİTAK BİLGEM Yerli Model Girişimi

2.6. T3 AI Baykar + T3 Foundation İş Birliği

3. Karşılaştırma Tablosu: 2026 Türkçe Açık Kaynak LLM Manzarası

3.1. Tokenization: Türkçe LLM'lerin Gizli Maliyet Boyutu

3.2. Lisans Karmaşası: Apache 2.0 vs Llama Community vs Custom

3.3. OpenLLM-TR-Leaderboard: Standardize Skor

4. Pratik Uygulama: Hangi Modeli Hangi Senaryo İçin Seçmeli?

4.1. Self-Host Setup: vLLM + Trendyol-LLM-7B-v3 (En Yaygın Senaryo)

4.2. 70B Senaryo: Trendyol-LLM-70B-v3 + 4xH100 veya 2xH200

5. Performans / Benchmark Karşılaştırması

5.1. TUMLU (Turkish MMLU) Detayı

5.2. Tokenization Verimliliği

6. Türkiye'ye Özgü Açı: KVKK, BDDK ve AI Egemenliği

6.1. KVKK Açısı

6.2. BDDK Açısı

6.3. Savunma Sanayi (ITAR / EAR / Türk Yasası)

7. Vaka Çalışmaları: Türkçe Açık Kaynak LLM Üretimde

Vaka 1 — Türk E-ticaret Şirketi: Trendyol-LLM-7B-v3 Müşteri Asistanı

Vaka 2 — Türk Bankası: Cosmos-Llama-1-70B + BDDK Uyumlu RAG

Vaka 3 — Sağlık Grubu: Kumru AI Edge Deploy + KVKK

8. Riskler ve Maliyet

8.1. Lisans Riskleri (Llama Community)

8.2. Süreklilik Riski (Maintainer Bağımlılığı)

9. Sıkça Sorulan Sorular

10. Bir Sonraki Adım

Kaynaklar

Bu yazıya en yakın consulting sayfaları

Kurumsal RAG Sistemleri Gelistirme

AI Evaluation, Guardrails ve Observability

CTO'lar icin Kurumsal AI Mimari Danismanligi

Yorumlar

Yorumlar

LLMOps: Üretim Sınıfı LLM Operasyonları

AI Governance ve EU AI Act Uyumu