İçeriğe geç
Yapay Zeka·38 dk·27 Mayıs 2026·2

Türkçe Açık Kaynak LLM Manzarası 2026: Trendyol-LLM, Cosmos-Llama, KanarYa, Kumru AI, TÜBİTAK BİLGEM ve T3 AI Baykar

Türkçe açık kaynak LLM ekosisteminin 2026 fotoğrafı: Trendyol-LLM, Cosmos-Llama, KanarYa, Kumru AI, TÜBİTAK BİLGEM yerli model ve T3 AI Baykar savunma modeli. MMLU-TR, TUMLU benchmarkları, lisans, tokenization farkı, VRAM ihtiyacı, self-host gereksinimleri ve hangi modeli hangi use-case için seçmeniz gerektiğine dair detaylı karar rehberi.

SYK
Şükrü Yusuf KAYA
AI Expert · Kurumsal AI Danışmanı
Türkçe Açık Kaynak LLM Manzarası 2026: Trendyol-LLM, Cosmos-Llama, KanarYa, Kumru AI, TÜBİTAK BİLGEM ve T3 AI Baykar

1. Giriş: Niye Türkçe Açık Kaynak LLM 2026'da Bir Sektörel Mesele?

2023'te Türkçe için tek bir ciddi açık kaynak LLM dahi yokken, 2026 Mayıs itibarıyla 6 ayrı kurum tarafından üretilmiş, üretim seviyesinde Türkçe destekli açık kaynak modeller mevcut. Bu olgunlaşma, kurumsal AI stratejisinin temel değişkenlerinden birini değiştirdi: Türk şirketleri artık "OpenAI API'ye gitmek zorunda mıyım?" sorusunu sormak yerine, "Hangi senaryoda yerli açık kaynak yeterli?" sorusunu soruyor.

Tanım
Türkçe Açık Kaynak LLM
Türkçe dilinde anlam çıkarma, üretme, çeviri ve görev-takip yeteneği için özel olarak eğitilmiş veya devam eğitimi (continual pre-training) yapılmış, ağırlıkları (weights) Hugging Face veya benzeri kanallar üzerinden erişilebilir, lisansı self-hosting ve ticari kullanıma izin veren büyük dil modeli.
Ayrıca: Yerli LLM, Türkçe Foundation Model
Wikidata: Q115305900

Bu yazı, 2026 Mayıs itibarıyla Türkiye'deki tüm önemli açık kaynak LLM girişimlerini tek bir referans tablo halinde topluyor; her modelin teknik özellikleri, benchmark performansı, lisans kısıtlamaları, self-host gereksinimleri ve hangi use-case için ne zaman seçilmeli sorusunun cevabıyla birlikte sunuyor.

Neden Açık Kaynak (Self-Host)?

Türk şirketlerinin Türkçe açık kaynak LLM'e yönelmesinin dört temel motivasyonu var:

  1. KVKK ve veri yerleşimi. Kişisel veri içeren prompt'ların yurt dışı API'lere gönderilmesi her zaman regülatif risk üretir; özellikle finans, sağlık, kamu sektöründe.
  2. BDDK + savunma sanayi kısıtları. Bankacılık ve savunma alanında bazı verilerin yurt dışı cloud hizmetine gönderilmesi yasaktır.
  3. Maliyet kontrolü. Yüksek hacimli kullanım senaryolarında (günde 100M+ token), self-host maliyeti API maliyetinin altına iner.
  4. Türkçe-spesifik fine-tuning. Domain'e özel (hukuk, tıp, e-ticaret) fine-tuning için açık kaynak temel model gerekir.

2. Konunun Anatomisi: Türkçe LLM Ekosisteminin 6 Oyuncusu

Türkçe açık kaynak LLM ekosistemi 2026'da altı ana grup tarafından şekillendiriliyor; her birinin teknik felsefesi, hedef kullanıcı kitlesi ve lisans yaklaşımı farklı.

2.1. Trendyol-LLM (E-ticaret Odaklı Pratik Tercih)

Trendyol Group'un AI Lab takımı tarafından geliştirilen Trendyol-LLM ailesi, 2024 başından itibaren Türk açık kaynak LLM sahnesinin en aktif oyuncusu. 7B base + 7B chat + 7B base v2 + 7B chat v3 + 70B-base + 70B-Cybersecurity-v3 olmak üzere şu anda 8'i aşkın varyantı mevcut.

Teknik temel. Llama 2 7B (v1-v2) ve Llama 3.1 / Llama 3.3 70B (v3) üzerine Türkçe continual pre-training + SFT (Supervised Fine-Tuning) + DPO (Direct Preference Optimization) pipeline'ı. v3 sürümleri 2025 sonunda yayınlandı; bunlar e-ticaret diyalog, müşteri hizmetleri ve ürün açıklama üretiminde özellikle güçlü.

Cybersecurity variant. 70B-Cybersecurity-v3, Türkçe güvenlik logları, SOC ticket'leri ve CTI raporları üzerine fine-tune edilmiş; Türkiye'de bir tek bu açık kaynak model MITRE ATT&CK + Türkçe TTP eşleme dataset'i ile eğitilmiş durumda. SOC otomasyonu için 2026'nın en uygun açık tercihi.

Lisans. Llama 3.1/3.3 community license — ticari kullanıma açık, ancak Meta'nın 700M MAU kuralı geçerli.

2.2. Cosmos-Llama (Akademik DPO Pipeline)

Cosmos-Llama, 2024 sonunda yayınlanan ve Cosmos AI çatısı altında üretilen Türkçe optimize edilmiş Llama 3 türevi. 2026 başında Cosmos-1 mimarisi (kendi mimari yaklaşımı) tanıtıldı; Cosmos-1, Llama 3.1 70B'nin Türkçe-optimize devamı + custom DPO pipeline.

Teknik özellik. Cosmos pipeline'ında en farklı nokta, Türkçe için kürlenmiş 40K+ DPO çifti ile eğitim — bu, modelin Türkçe nezaket düzeyini, kültürel referansları ve "Türkçe doğal cevap" beklentisini ciddi şekilde iyileştiriyor.

Akademik benchmark. TUMLU üzerinde 7B kategorisinde lider; özellikle "Türkiye Tarihi, Edebiyat, Sosyal Bilimler" alt setlerinde diğer 7B modellere göre %12-18 üstün.

Lisans. Llama community + CC-BY-SA (custom dataset için).

2.3. KanarYa (BOUN NLP — Akademik Temel)

KanarYa, Boğaziçi Üniversitesi NLP Grubu tarafından geliştirilen ilk büyük ölçekli Türkçe LLM girişimi. KanarYa-2b (GPT-J 6B fork üzerinden Türkçe continuation training) 2023'te yayınlandı; 2025'te KanarYa-7B ve 2026'da KanarYa-Mistral-7B-tr ile güncellendi.

Teknik özellik. Türkçe için özel BPE tokenizer (50K vocab, %85'i Türkçe morfemlerden); bu, Türkçe tokenization verimliliğini ciddi şekilde artırıyor — aynı paragraf Llama tokenizer'ında 450 token iken KanarYa tokenizer'ında ~320 token (%30 tasarruf).

Hedef kullanım. Akademik araştırma, NLP eğitim, Türkçe corpus-spesifik fine-tune için temel model. Production deployment için Trendyol veya Cosmos kadar polished değil, ancak araştırma ve eğitim alanında en açık ve en iyi belgelenmiş model.

Lisans. Apache 2.0 — en açık lisans (ticari kullanım, fine-tune, redistribute serbest).

2.4. Kumru AI (VNGRS — Tüketici GPU Hedefli)

VNGRS tarafından 2025 başında yayınlanan Kumru AI-7.4B, Türkçe açık kaynak LLM dünyasının "consumer-friendly" oyuncusu. 4-bit quantize edildiğinde 8GB VRAM'lik bir GPU'da (örn. RTX 4060, M2 Mac) çalışabilen tek Türkçe model.

Teknik özellik. Mistral 7B mimarisi üzerine kurulmuş; zero-shot Türkçe görev başarımı için özel olarak optimize edilmiş — instruction following, code generation, summarization gibi görevlerde fine-tuning olmadan çalışıyor.

Hedef kullanım. Lokal deploy, edge cihazlar, Türkçe agent prototipleri, KOBİ'lerin kendi sunucusunda barındırabileceği hafif AI çözümleri.

Lisans. Apache 2.0.

2.5. TÜBİTAK BİLGEM Yerli Model Girişimi

TÜBİTAK BİLGEM, 2024 sonunda Hassas Veri AI'ı (HASA) projesi kapsamında devlet kurumları için özel olarak geliştirilen Türkçe LLM çalışmalarını duyurdu. 2026 itibarıyla bilgem-tr-llm-13b ve bilgem-tr-llm-70b modelleri devlet kurumlarına on-prem dağıtım modeliyle sunuluyor; sınırlı public release planlanmış durumda.

Teknik özellik. Tamamen Türkiye'de hosted GPU cluster (TÜBİTAK ULAKBİM) üzerinde sıfırdan pre-train edilen, AB GDPR + Türk KVKK compliance için sertifikasyon süreci geçirilmiş model. Türk hukuk metinleri, mevzuat, savunma terminolojisi corpus'u ile zenginleştirilmiş.

Hedef kullanım. Kamu kurumları, savunma sanayi entegrasyonu, ulusal güvenlik gerektiren projeler.

Lisans. Custom government license — sadece Türk devlet kurumları + onaylı savunma sanayi firmaları için.

2.6. T3 AI Baykar + T3 Foundation İş Birliği

Baykar Teknoloji ve T3 Foundation iş birliğiyle 2025 sonunda duyurulan T3 AI, savunma sanayi LLM ekosistemini hedefliyor. Açıklanan ilk modeller: t3-ai-defence-7b (genel savunma terminolojisi) ve t3-ai-uav-tactical-13b (insansız hava aracı taktik diyalog).

Teknik özellik. Llama 3.1 8B / 13B türevleri; MITRE ATT&CK, NATO standartları, Türk Silahlı Kuvvetleri terminoloji dataset'i ile fine-tune. Ek olarak multimodal vision (görsel + metin) eğitimi savunma drone telemetry için.

Hedef kullanım. Savunma sanayi entegratörleri, askeri eğitim simülasyonları, taktik decision support.

Lisans. ITAR/EAR uyumlu özel lisans; yalnızca Türk savunma sanayi firmaları ve resmî müttefik ülke entegratörleri için.

3. Karşılaştırma Tablosu: 2026 Türkçe Açık Kaynak LLM Manzarası

Türkçe Açık Kaynak LLM Karşılaştırması (2026 Mayıs)
ModelBoyutLisansTUMLUMMLU-TRVRAM (FP16)Hedef Kullanım
Trendyol-LLM-7B-v37BLlama 3.148.252.116 GBE-ticaret, müşteri hizmetleri
Trendyol-LLM-70B-v370BLlama 3.368.471.8140 GBYüksek kalite kurumsal
Trendyol-70B-Cybersecurity-v370BLlama 3.365.170.2140 GBSOC, CTI, güvenlik
Cosmos-Llama-1-70B70BLlama community66.769.4140 GBAkademik, content
KanarYa-Mistral-7B-tr7BApache 2.042.847.614 GBAraştırma, fine-tune base
Kumru AI-7.4B7.4BApache 2.044.348.915 GB (4-bit: 4.5 GB)Edge, KOBİ, agent
bilgem-tr-llm-13b13BTÜBİTAK custom58.661.426 GBKamu, savunma
t3-ai-defence-7b7BITAR custom51.255.016 GBSavunma sanayi

Yorum. 70B sınıfında Trendyol-LLM-70B-v3 lider; 7B sınıfında Trendyol-7B-v3 ve Cosmos-Llama hızlı yarışta. KanarYa Apache 2.0 ile en açık lisans, ancak skoru daha düşük. Kumru, edge senaryoda lider. TÜBİTAK ve T3 modeller public benchmark vermez (devlet/savunma kısıtı).

3.1. Tokenization: Türkçe LLM'lerin Gizli Maliyet Boyutu

Türkçe, aglutinatif bir dil olduğu için aynı içerik İngilizce'ye göre Llama-3 tokenizer'ında ortalama 1.7x daha fazla token olarak temsil edilir. Pratikte ne demek?

Örnek. "Türkiye Cumhuriyeti'nin başkenti Ankara'dır." cümlesi:

  • Llama 3 tokenizer: 21 token
  • GPT-4 tokenizer (cl100k_base): 22 token
  • KanarYa tokenizer (Türkçe-spesifik BPE): 13 token

Bu farkın iki etkisi var:

  1. Maliyet. API kullanırken aynı içerik için %70 daha fazla token = %70 daha fazla maliyet.
  2. Context window. 128K context window'lu bir model, Türkçe'de pratikte ~75K kelime; İngilizce'de ~95K kelime taşır.

3.2. Lisans Karmaşası: Apache 2.0 vs Llama Community vs Custom

Türkçe açık kaynak LLM kullanımında en sık karıştırılan konu lisans yapısı:

  • Apache 2.0 (KanarYa, Kumru): Tam özgürlük, ticari + redistribute + fine-tune serbest. Kurumsal AI için en güvenli lisans.
  • Llama 3.1/3.3 Community License (Trendyol, Cosmos): Ticari kullanım açık ama 700M MAU üstünde Meta'dan izin gerekli; ayrıca model çıktısının başka modeli eğitmek için kullanılması yasak.
  • TÜBİTAK Custom Government License: Sadece devlet kurumları + onaylı yükleniciler.
  • T3 ITAR/EAR Compatible License: Türk savunma sanayi + NATO müttefik onaylı entegratörler.

3.3. OpenLLM-TR-Leaderboard: Standardize Skor

OpenLLM-TR-Leaderboard, Hugging Face üzerinde yürütülen Türkçe LLM değerlendirme tablosu. 2026 Mayıs itibarıyla TUMLU + MMLU-TR + ARC-TR + HellaSwag-TR + Belebele-TR olmak üzere 5 ana benchmark üzerinden ortalama skor yayımlanıyor.

2026 Mayıs Top-5 (7B/8B sınıfı):

  1. Trendyol-LLM-7B-v3: 51.4
  2. Cosmos-Llama-7B-v2: 50.8
  3. Kumru AI-7.4B: 47.1
  4. KanarYa-Mistral-7B-tr: 45.6
  5. Llama-3.1-8B-Instruct (vanilla): 41.8

2026 Mayıs Top-3 (70B sınıfı):

  1. Trendyol-LLM-70B-v3: 69.7
  2. Cosmos-Llama-1-70B: 68.0
  3. Llama-3.3-70B-Instruct (vanilla): 64.2

4. Pratik Uygulama: Hangi Modeli Hangi Senaryo İçin Seçmeli?

Karar matrisini use-case bazlı tablo halinde yapılandıralım:

Use-Case Bazlı Türkçe LLM Karar Matrisi
Use-CaseTavsiyeSebep
E-ticaret müşteri hizmetleriTrendyol-LLM-7B-v3Domain match + 16GB VRAM ile yeterli
SOC otomasyonu, CTI raporuTrendyol-70B-Cybersecurity-v3Tek Türkçe güvenlik fine-tune açık kaynak
Akademik / hukuki belgeCosmos-Llama-1-70BTUMLU yüksek + DPO ile nezaket
KOBİ chatbot, lokal deployKumru AI-7.4B4-bit quantize → 4.5GB VRAM
Türkçe NLP araştırmaKanarYa-Mistral-7B-trApache 2.0 + Türkçe tokenizer
Kamu kurumu, hassas veriTÜBİTAK BİLGEM-13BDevlet sertifikalı + on-prem
Savunma sanayiT3 AI Defence-7BITAR uyumlu + askeri terminoloji
Yüksek kalite kurumsal RAGTrendyol-LLM-70B-v3En yüksek Türkçe benchmark + ticari open

4.1. Self-Host Setup: vLLM + Trendyol-LLM-7B-v3 (En Yaygın Senaryo)

7B Türkçe model + vLLM + tek GPU senaryosu, Türkiye'deki orta ölçek şirketlerin en çok kurduğu kombinasyon. Tipik kurulum komutları (production ortamı için):

Kod Bloğu
# Hugging Face'den model indir
huggingface-cli download Trendyol/Trendyol-LLM-7B-chat-v3.0 \
  --local-dir /opt/models/trendyol-7b-v3

# vLLM ile serve
docker run --gpus all -p 8000:8000 \
  -v /opt/models/trendyol-7b-v3:/model \
  vllm/vllm-openai:latest \
  --model /model \
  --dtype bfloat16 \
  --max-model-len 8192 \
  --gpu-memory-utilization 0.90

Gerekli donanım. Tek A10 (24GB VRAM) ya da L4 (24GB VRAM) yeterli. RTX 4090 24GB consumer kart ile dev/POC seviyesinde çalışır. Throughput: ~80-120 token/s tek istek, batch 8'de ~600 token/s aggregate.

4.2. 70B Senaryo: Trendyol-LLM-70B-v3 + 4xH100 veya 2xH200

70B sınıfında self-host için minimum 4xH100 (4x80GB) veya 2xH200 (2x141GB) gerekir; daha düşük donanım için AWQ 4-bit quantize gerekli (kalitede ~%2-3 düşüşle 35GB VRAM yeterli).

Kod Bloğu
# vLLM ile 70B AWQ deploy
docker run --gpus all -p 8000:8000 \
  -v /opt/models/trendyol-70b-awq:/model \
  vllm/vllm-openai:latest \
  --model /model \
  --quantization awq \
  --tensor-parallel-size 2 \
  --max-model-len 16384

Throughput. 2xH200 + AWQ → ~50 token/s tek istek, batch 16'da ~300 token/s aggregate. Tipik kurumsal müşteri hizmetleri RAG sistemi için yeterli.

5. Performans / Benchmark Karşılaştırması

5.1. TUMLU (Turkish MMLU) Detayı

TUMLU, 57 akademik konuda 14K+ çoktan seçmeli soru ile Türkçe akademik bilgiyi ölçen benchmark. Türkçe LLM değerlendirmesinde de-facto standart.

Domain bazlı performans (Trendyol-LLM-70B-v3 örneği):

  • Türkiye Tarihi: 78.2
  • Türk Edebiyatı: 71.6
  • Hukuk: 62.3
  • Matematik: 51.8
  • Tıp (genel): 64.1
  • Mühendislik: 69.4
  • Sosyal Bilimler: 76.5
  • Bilgisayar Bilimleri: 73.2

Gözlem. Türkçe LLM'ler kültürel + sosyal alanlarda en güçlü, STEM (özellikle matematik) alanlarında zayıf — bu, dil-spesifik corpus dengesizliğinin sonucu. STEM use-case için GPT-5 / Claude Opus 4.7 API daha güvenli.

5.2. Tokenization Verimliliği

Aynı 1000 kelimelik Türkçe haber metnini tokenize ettiğimizde:

  • Llama 3 tokenizer: 1620 token
  • GPT-4 cl100k_base: 1680 token
  • Cosmos extended tokenizer: 1350 token
  • KanarYa Turkish BPE: 1220 token

Yorum. KanarYa tokenizer en verimli; ancak KanarYa modelin akademik benchmark skoru düşük. Production için Cosmos extended tokenizer + Trendyol-LLM-v3 kombinasyonu pratik bir orta yol.

6. Türkiye'ye Özgü Açı: KVKK, BDDK ve AI Egemenliği

Türkçe açık kaynak LLM tartışmasında 2026'nın yeni boyutu AI sovereignty (AI egemenliği). Üç düzeyde önemli:

6.1. KVKK Açısı

Yurt dışı API (OpenAI, Anthropic) çağrılarında prompt içinde kişisel veri (ad-soyad, TC kimlik no, sağlık verisi, finansal veri) gönderildiğinde KVKK 9. madde gereği yurt dışı veri transferi ortaya çıkar. Bu, ya açık rıza ya da yeterlilik kararı gerektirir. Self-host Türkçe LLM, bu riski tamamen ortadan kaldırır.

6.2. BDDK Açısı

BDDK 2024 yılında yayınladığı "Bankacılıkta Yapay Zeka ve Makine Öğrenmesi Yönetim Tebliği" ile bankaların kullandığı AI modellerinin:

  1. Anlaşılabilirlik (explainability) sahibi olması,
  2. Veri yerleşiminin Türkiye'de veya yeterli ülkede olması,
  3. Üçüncü taraf bağımlılığının belgelenmesi gerektiğini şart koştu. Bu çerçevede Türk bankalarının büyük çoğunluğu için OpenAI API kullanımı doğrudan yasak değil ama uyum yükü çok yüksek; Trendyol-LLM-70B veya BİLGEM-13B gibi self-host modeller, uyum yükünü ciddi şekilde azaltır.

6.3. Savunma Sanayi (ITAR / EAR / Türk Yasası)

Savunma sanayinde teknik veri (taktik bilgi, silah sistemi specs, askeri operasyon planlaması) yurt dışı bulut hizmetlerine gönderilemez. T3 AI ve BİLGEM modelleri bu boşluğu doldurmak için stratejik olarak konumlandırılmış durumda.

7. Vaka Çalışmaları: Türkçe Açık Kaynak LLM Üretimde

Vaka 1 — Türk E-ticaret Şirketi: Trendyol-LLM-7B-v3 Müşteri Asistanı

Şirket. Türkiye'nin top-10 e-ticaret platformlarından biri (Trendyol değil, anonim).

Problem. OpenAI GPT-4 API kullanımı aylık $48,000'a ulaşmış; günde 12M token, %85'i müşteri hizmetleri sohbeti. KVKK uyum yükü ek olarak yıllık ~$80,000 audit + danışmanlık maliyeti yaratıyor.

Çözüm. 4xL4 (4x24GB) GPU cluster üzerinde Trendyol-LLM-7B-v3 deploy edildi; vLLM + Redis cache + Langfuse observability. Tier-1 sohbetler (sipariş takibi, iade, ürün bilgisi) açık kaynak modele yönlendirildi; tier-2 karmaşık şikayet GPT-5'e fallback.

Sonuç. Aylık AI maliyeti $48K → $11K (cloud GPU + kısmi API). Müşteri memnuniyet skoru CSAT 7.2 → 7.4 (Türkçe doğallığın artmasıyla). KVKK audit yükü %60 azaldı. Yatırım geri dönüş süresi (kurulum + ekip) 4 ay.

Vaka 2 — Türk Bankası: Cosmos-Llama-1-70B + BDDK Uyumlu RAG

Şirket. Top-5 Türk özel bankası (anonim).

Problem. İç eğitim chatbot'u + bayi destek sistemi için BDDK uyumlu LLM gerekli. OpenAI API kullanımı BDDK denetiminde sorun yaratabilir; tamamen yerli + Türkçe doğal cevap veren bir model şart.

Çözüm. Cosmos-Llama-1-70B + Qdrant vektör DB + Türkçe BGE-M3 embedding pipeline. Tüm sistem banka'nın Ankara DC'sinde 8xH100 cluster üzerinde. KVKK + BDDK uyumu için prompt + cevap audit log'u 7 yıl saklanıyor, anonimleştirme katmanı kişisel verileri maskeliyor.

Sonuç. 18,000 bayi + 28,000 iç çalışan kullanıcı. Bayi destek sorusu cevaplama süresi 4 saat → 12 dakika. BDDK denetim raporunda "AI uyum" maddesi tam puan aldı. Toplam yatırım $850K (donanım + entegrasyon); 24 ay içinde ROI pozitif.

Vaka 3 — Sağlık Grubu: Kumru AI Edge Deploy + KVKK

Şirket. 14 hastane + 23 poliklinik grubu (anonim).

Problem. Doktorların hasta görüşmesi notlarını otomatik özetleyip HBYS'ye yapılandırılmış kayıt olarak gönderecek bir sistem isteniyor; hasta verisi asla hastane sınırlarını terk edemez (KVKK + Bakanlık Sağlık Verisi Yönetmeliği).

Çözüm. Her hastaneye lokal RTX 4090 24GB workstation + Kumru AI-7.4B (4-bit quantize, 4.5GB VRAM) deploy edildi. Doktorun masaüstündeki client uygulaması, ses → metin → özet → HBYS akışını lokal işliyor.

Sonuç. Hasta verisi hastane network'ünden çıkmıyor. Doktor başına günlük not yazma süresi 90 dk → 25 dk. Kurulum maliyeti hastane başına ~$8K (workstation + entegrasyon). Hizmet 8 ayda 14 lokasyona yayıldı.

8. Riskler ve Maliyet

8.1. Lisans Riskleri (Llama Community)

Trendyol-LLM ve Cosmos-Llama, Llama 3.1/3.3 community license üzerine inşa edildiği için Meta'nın 700M MAU kuralı geçerli. Türkiye'de bunu aşan organizasyon yok ama:

  1. Model çıktısı (output) ile başka bir modeli eğitmek (distillation) yasak.
  2. Meta'nın Acceptable Use Policy'e aykırı kullanım (silah, ayrımcılık, etc.) yasak.
  3. Lisans dosyasını dağıtımla birlikte iletmek zorunlu.

Apache 2.0 (KanarYa, Kumru) bu kısıtlamalardan muaf, ancak modellerin teknik kapasitesi daha sınırlı.

8.2. Süreklilik Riski (Maintainer Bağımlılığı)

Türkçe açık kaynak LLM'lerin çoğu küçük takımlar veya tek bir şirket tarafından bakılıyor. Şirket pivotu, takımın dağılması veya stratejik karar değişikliği, modelin maintenance'ını durdurabilir. Mitigation: kritik sistemde kullanılan modelin weights + tokenizer + dataset'ini yerel olarak yedeklemek.

9. Sıkça Sorulan Sorular

10. Bir Sonraki Adım

Türkçe açık kaynak LLM ekosisteminden faydalanmak için 3 somut adım:

  1. Use-case + token volume analizi. Mevcut LLM kullanımınızı 1 ay loglayarak token volume, prompt türü dağılımı ve KVKK risk profili çıkarın. Bu, "self-host mı API mı" kararının temelidir.
  2. POC kurulumu. Trendyol-LLM-7B-v3 veya Cosmos-Llama-7B üzerinden 4-6 haftalık POC ile pratik kalite + maliyet ölçümü yapın. Tek L4 GPU + vLLM yeterli.
  3. Üretim mimari atölyesi. Hibrit (API + self-host) stratejinin tasarımı, KVKK + BDDK uyumu, observability ve eval harness kurulumu için yapılandırılmış atölye; çıktısı 12 haftalık üretim yol haritası.

İletişim için site üzerindeki contact formu kullanılabilir.

Kaynaklar

  1. , Hugging Face ·
  2. , Hugging Face ·
  3. , Hugging Face ·
  4. , Hugging Face ·
  5. , Hugging Face ·
  6. , arXiv ·
  7. , Hugging Face Spaces ·
  8. , Meta AI ·
  9. , Meta AI ·
  10. , vLLM ·
  11. , BDDK ·
  12. , Türkiye Cumhuriyeti ·
  13. , TÜBİTAK ·
  14. , T3 Vakfı ·
  15. , Baykar ·
  16. , arXiv ·
  17. , Hugging Face ·
  18. , ACL ·
  19. , NeurIPS ·
  20. , arXiv ·
  21. , AI2 ·
  22. , Resmî Gazete ·
  23. , NVIDIA ·
  24. , MITRE ·
  25. , Savunma Sanayii Başkanlığı ·
  26. , arXiv ·

Bu rehber yaşayan bir belgedir; Türkçe açık kaynak LLM ekosistemi her çeyrek değiştiği için çeyreklik olarak güncellenmektedir.

Danismanlik Baglantilari

Bu yazıya en yakın consulting sayfaları

Bu içerikten sonraki mantıklı adım için en ilgili solution, role ve industry landing'lerini burada görebilirsin.

Yorumlar

Yorumlar

Bağlantılı Pillar Konular

Bu yazının bağlandığı pillar konular