İçeriğe geç

Capstone Brief: Kendi Niş Domain'inde Uçtan Uca FT Projesi — 12 Adımlı Yol Haritası

Cookbook'un final projesi: 4-6 hafta sürecek uçtan uca FT projesi. Niş domain seç (sağlık / hukuk / e-ticaret / kamu / eğitim / finans / edebiyat / spor / oyun / tarih / vs.), veri topla, tokenizer extend et, continual PT yap, SFT + DPO, quantize, vLLM ile deploy, eval, model card, public release. Cookbook'un tüm 19 Part'ını uygulamalı entegre eder.

Şükrü Yusuf KAYA
28 dakikalık okuma
İleri
Capstone Brief: Kendi Niş Domain'inde Uçtan Uca FT Projesi — 12 Adımlı Yol Haritası

1. 12-Adımlı Yol Haritası#

1. Niş domain seç (1 saat) - Örnek: "Türk Hukuku Sözleşme Analizi", "TR Tarih QA", "BIST Bilanço Anal.", "Lise Felsefe Tutor", "TR Edebiyat Eleştirisi", "Türk Tıbbi Kılavuzlar", "TR Mutfak Tarif Asistan" 2. Veri toplama (1 hafta) - Public datasets (HF, Kaggle) - Web crawl (KVKK + ToS uyumlu) - Synthetic generation (R1 / Llama-3-70B teacher) - Hedef: 5-50K SFT example + 5K DPO pair 3. Tokenizer extension (1 gün) - Domain-spesifik token (örn. hukuk için "madde", "fıkra", "bend") - Part IX Ders 9.3 reçetesi 4. Continual pre-training (2-3 gün) - 500M-2B token domain corpus - Part IX Ders 9.4 (replay buffer + LR strategy) 5. SFT (1-2 gün) - 5-10K curated TR SFT - Part III Ders 3.1 reçetesi 6. DPO (1 gün) - 5K preference pair (RLAIF + AI feedback) - Part XI Ders 11.2 7. Quantization (1 saat) - AWQ int4 + GGUF Q4_K_M - Part X Ders 10.3 + 10.4 8. Deploy (1 gün) - vLLM endpoint + LoRA hot-swap - Part XV Ders 15.1 9. Eval (1 gün) - TR-MMLU + Mukayese + custom domain bench - Part IX Ders 9.10 10. Compliance check (1 gün) - EU AI Act sınıflandırma + KVKK + lisans - Part XVIII Ders 18.1-4 11. Model Card + Datasheet (2 saat) - HF template, bias section - Part XVIII Ders 18.5 12. Public release (1 saat) - HF Hub privat → public - Twitter / LinkedIn announcement - Sertifika başvurusu
💡 Cookbook'un mottosu
Capstone'u bitiren herkesin elinde, dünyada başka kimsenin yapmadığı niş bir TR LLM'i olur. Bu LLM, cookbook'un 19 Part'lık disiplinini somut bir çıktıya dönüştürür. Cookbook bittikten 6 ay sonra: "production'da kullanıyorum, 500 vatandaş günlük kullanıyor" diyebilirsen, cookbook'un en derin kazanımını almışsın demektir.
✅ Teslim
  1. Niş domain'ini bugün seç. 2) 12 adımlı plan'ı kendi takviminle haftalara böl. 3) Sonraki ders: C.2 — Final Run Telemetry Raporu.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

İlgili İçerikler

Capstone Brief: Kendi Niş Domain'inde Uçtan Uca FT Projesi | Fine-Tuning Cookbook (Model-by-Model)