Kavram SözlüğüDoğal Dil İşleme
Ön Eğitim Korpusu
Dil modelinin genel dil bilgisi ve dünya bilgisi edinmek için kullandığı büyük metin veri havuzu.
Ön eğitim korpusu, bir modelin hangi dil kalıplarını, alan bilgilerini ve kültürel örüntüleri öğreneceğini güçlü biçimde belirler. Veri miktarı kadar veri çeşitliliği, temizlik seviyesi, lisans yapısı ve dil dağılımı da kritik önemdedir. Büyük modellerin davranışı çoğu zaman mimariden önce korpus karakteriyle şekillenir. Bu nedenle veri seçimi, model tasarımının ayrılmaz parçasıdır.
İlginizi Çekebilir
Yapay zeka yolculuğunuza devam etmek için bu kavramlara da göz atabilirsiniz.
