İçeriğe geç

Yapay Zeka Etkileşimli Araçları

Türkçe LLM Performans Karşılaştırıcı

16+ LLM Türkçe benchmark + use-case skor + domain (banka/hukuk/sağlık) + maliyet + bölge.

Tanım
Türkçe LLM Benchmark
Büyük dil modellerinin Türkçe dilinde performansını ölçen standart eval setleri: MMLU-TR, TruthfulQA-TR, Reasoning-TR, sektörel domain testleri + token verimi ölçümleri.
Ayrıca: TR-MMLU, Türkçe LLM eval, TR benchmark, Cosmos, Trendyol LLM

Seçim

Modeller (4)

Sonuçlar

Üyelik Gerekli

Türkçe LLM Performans Karşılaştırıcı sonuçları üyelere açıktır

Form girdilerinizi dilediğiniz gibi değiştirebilirsiniz; sonuç tablosu, grafikler ve PDF rapor üyelik gerektirir. Üye olduğunuzda mevcut girdileriniz korunur.

  • Üretilen rapor ve PDF'leri panelinizden tekrar indirin
  • Yeni araçlar ve KVKK + EU AI Act güncellemelerinden haberdar olun
  • Kaynak Merkezi, Forum ve Öğrenme Portalı'na tam erişim

KVKK uyumlu kayıt — sadece ad ve e-posta. Reklam göndermeyiz, istediğin an silebilirsin.

Sıkça Sorulan Sorular

  • MMLU-TR, TruthfulQA-TR, Belebele, Artificial Analysis benchmark seti + dahili Q1 2026 kalibrasyon.

Kaynaklar

  1. , Hendrycks et al.
  2. , Lin et al.
  3. , Meta
  4. , Artificial Analysis