İçeriğe geç
Tüm roadmap'e dön
topicfoundation

LLM Nasıl Çalışır?

Transformer mimarisi, attention, decoding — modelin neyi neden yaptığını bil.

3-5 saat4 saat3 kaynak

LLM'ler bir sonraki token'ı tahmin eden olasılık makineleri. Transformer mimarisindeki self-attention mekanizması, modelin bağlamdaki kelimeler arasında ilişki kurmasını sağlar. Decoding (greedy, sampling, beam search) ise olasılık dağılımından nasıl token seçileceğini belirler.

Neden önemli: Prompt'larınızın neden bazı durumlarda iyi, bazılarında kötü sonuç verdiğini anlamak için modelin iç mantığını bilmek şart.

Neden öğreniyoruz?

Prompt mühendisliği bir tahmin oyunu değil — modelin nasıl çalıştığını bilmeden yazılan promptlar fragile olur.

Ne kazanırsın?

Bir prompt yazdığında modelin attention'ı nereye yoğunlaşacak, hangi token'lar daha olası olacak — sezgisel olarak öngörebilirsin.

Kaynaklar(3)