Yapay Zeka Etkileşimli Araçları
Türkçe LLM Performans Karşılaştırıcı
16+ LLM Türkçe benchmark + use-case skor + domain (banka/hukuk/sağlık) + maliyet + bölge.
Tanım
- Türkçe LLM Benchmark
- Büyük dil modellerinin Türkçe dilinde performansını ölçen standart eval setleri: MMLU-TR, TruthfulQA-TR, Reasoning-TR, sektörel domain testleri + token verimi ölçümleri.
- Ayrıca: TR-MMLU, Türkçe LLM eval, TR benchmark, Cosmos, Trendyol LLM
Seçim
Modeller (4)
Sonuçlar
Üyelik Gerekli
Türkçe LLM Performans Karşılaştırıcı sonuçları üyelere açıktır
Form girdilerinizi dilediğiniz gibi değiştirebilirsiniz; sonuç tablosu, grafikler ve PDF rapor üyelik gerektirir. Üye olduğunuzda mevcut girdileriniz korunur.
- Üretilen rapor ve PDF'leri panelinizden tekrar indirin
- Yeni araçlar ve KVKK + EU AI Act güncellemelerinden haberdar olun
- Kaynak Merkezi, Forum ve Öğrenme Portalı'na tam erişim
KVKK uyumlu kayıt — sadece ad ve e-posta. Reklam göndermeyiz, istediğin an silebilirsin.
Sıkça Sorulan Sorular
- MMLU-TR, TruthfulQA-TR, Belebele, Artificial Analysis benchmark seti + dahili Q1 2026 kalibrasyon.
Kaynaklar
- MMLU — Measuring Massive Multitask Language Understanding, Hendrycks et al.
- TruthfulQA: Measuring How Models Mimic Human Falsehoods, Lin et al.
- Belebele Multilingual Reading Comprehension, Meta
- Artificial Analysis — TR Benchmark, Artificial Analysis