İçeriğe geç
Kavram SözlüğüDoğal Dil İşleme

Ön Eğitim Korpusu

Dil modelinin genel dil bilgisi ve dünya bilgisi edinmek için kullandığı büyük metin veri havuzu.

Ön eğitim korpusu, bir modelin hangi dil kalıplarını, alan bilgilerini ve kültürel örüntüleri öğreneceğini güçlü biçimde belirler. Veri miktarı kadar veri çeşitliliği, temizlik seviyesi, lisans yapısı ve dil dağılımı da kritik önemdedir. Büyük modellerin davranışı çoğu zaman mimariden önce korpus karakteriyle şekillenir. Bu nedenle veri seçimi, model tasarımının ayrılmaz parçasıdır.