Fine-Tuning Cookbook (Model-by-Model)

Bu cookbook'un kullanım kılavuzu: 5-bileşenli ders anatomisi (Theory/Math/Lab/Debug/Bench), Stage taksonomisi (Spike → Reference → Production → Research), reproducibility kontratı (bit-exact runs), RTX 4090 baseline'ı niye seçildi, GPU bütçeleme matematiği.

20 modül

177 ders

~5111 dk

İçindekiler

Part 0 — Engineering Foundations

1
Fine-Tuning Cookbook'a Hoş Geldin: Sistematik, Stage Taksonomisi ve Reproducibility Kontratı
Bu cookbook'un kullanım kılavuzu: 5-bileşenli ders anatomisi (Theory/Math/Lab/Debug/Bench), Stage taksonomisi (Spike → Reference → Production → Research), reproducibility kontratı (bit-exact runs), RTX 4090 baseline'ı niye seçildi, GPU bütçeleme matematiği.
2
Reproducibility Stack: Seeds, cuDNN Flags ve Deterministic CUDA — 'Sende Niye Çalışıyor Bende Çalışmıyor' Sorununu Bitir
ML'in en pahalı zaman tüketicisi: tekrar üretilemeyen sonuçlar. Bu derste seed yönetimi, cuDNN/cuBLAS deterministic flags, ATen non-deterministic op tespiti, dataloader worker'ların seed'lenmesi, deterministic scatter/gather'ların maliyeti — her şey pratik kod ve gerçek log'larla.
3
Environment Pinning: uv + pyproject.toml, CUDA Version Matrix ve Container Reçeteleri
Reproducibility'nin ikinci yarısı: lib versiyonlarını çivile, CUDA matrix'i anla, Docker/Apptainer reçetelerini yaz. uv'nin pip+poetry'yi 10-100x geçtiği noktalar, RTX 4090 için CUDA 12.4 PyTorch 2.5 stack'i, FT framework'lerinin (TRL, Unsloth, Axolotl) hangi versiyonlarının uyumlu olduğunu gösteren uyum matrisi.
4
Container & Slurm Recipes: Tek 4090'dan Cloud Multi-Node'a Doğru Köprü
Tek 4090'da hazırladığın eğitimi 8×H100 cluster'a taşıma kılavuzu: Slurm sbatch şablonu, multi-node NCCL setup, EFA/InfiniBand sanity check, Lambda/RunPod/CoreWeave/Vast'ın gerçek saat fiyatları, preemption-tolerant training, checkpoint manifest, FAULT_TOLERANCE prensipleri.
5
Experiment Tracking Mimarisi: Weights&Biases + Hydra + DVC — Sweep'in Mühendisliği
ML deneylerini disipline almak: Hydra ile config-driven runs, W&B ile sweep + system metrics + offline mode, DVC ile dataset/checkpoint versioning, alias/lineage tracking. Cookbook'un 'rapor edilebilir Lab' standardı: hangi run hangi commit hash + dataset hash + W&B run ID + checkpoint sha?

Part I — Hardware & Memory Engineering

Part II — Tokenizer & Data Engineering

Part III — Small Open Models (1B–8B)

Part IV — Mid-Large Models (13B-70B+) + Distributed Internals

Part V — MoE Internals & Fine-Tuning

Fine-Tuning Cookbook (Model-by-Model)

İçindekiler

Part 0 — Engineering Foundations

Part I — Hardware & Memory Engineering

Part II — Tokenizer & Data Engineering

Part III — Small Open Models (1B–8B)

Part IV — Mid-Large Models (13B-70B+) + Distributed Internals

Part V — MoE Internals & Fine-Tuning

Part VI — Vision-Language Multimodal FT

Part VII — Speech & Audio Fine-Tuning

Part VIII — Code Models & Repo-Level FT

Part IX — Türkçe-First & Yerelleştirme Mühendisliği

Part X — Quantization Engineering

Part XI — Alignment & Preference Optimization

Part XII — Reasoning Model FT (R1-style)

Part XIII — Custom Kernels & Performance Surgery

Part XIV — Closed-Source API Fine-Tuning

Part XV — Serving Engineering

Part XVI — Production Operations

Part XVII — Türkiye Use-Case Labs

Part XVIII — Compliance, Governance & Red-Teaming

Capstone — Build Your Own LLM

Bültenime Abone Olun