Tüm roadmap'e dön
topicfoundation
LLM Nasıl Çalışır?
Transformer mimarisi, attention, decoding — modelin neyi neden yaptığını bil.
3-5 saat4 saat3 kaynak
LLM'ler bir sonraki token'ı tahmin eden olasılık makineleri. Transformer mimarisindeki self-attention mekanizması, modelin bağlamdaki kelimeler arasında ilişki kurmasını sağlar. Decoding (greedy, sampling, beam search) ise olasılık dağılımından nasıl token seçileceğini belirler.
Neden önemli: Prompt'larınızın neden bazı durumlarda iyi, bazılarında kötü sonuç verdiğini anlamak için modelin iç mantığını bilmek şart.
Neden öğreniyoruz?
Prompt mühendisliği bir tahmin oyunu değil — modelin nasıl çalıştığını bilmeden yazılan promptlar fragile olur.
Ne kazanırsın?
Bir prompt yazdığında modelin attention'ı nereye yoğunlaşacak, hangi token'lar daha olası olacak — sezgisel olarak öngörebilirsin.