İçeriğe geç

Maliyet ve Etik Sözleşmesi: 8 Ay Bütçesi, Token Economics, AI Mühendisinin Ahlakı

Kursun toplam tahmini maliyeti üç senaryoda, token economics 101, bütçe alarmı kurma, AI mühendisinin etik sözleşmesi: telif hakları, KVKK, EU AI Act, akademik dürüstlük, açık-kaynak katkı, çevre etkisi.

Şükrü Yusuf KAYA
30 dakikalık okuma
Başlangıç
Maliyet ve Etik Sözleşmesi: 8 Ay Bütçesi, Token Economics, AI Mühendisinin Ahlakı
📜 Modül 0'ı bağlayan ders
Bu kursta 8 ay süreyle harcayacağın paranın ve etik sözleşmenin netleştirildiği son ders. Sonuna geldiğinde: aylık bütçen kafanda, etik sözleşmen 'imzalanmış', Modül 1'e geçmeye hazırsın.

Token Economics 101#

Bir LLM Engineer'ın günlük dilinde token para birimidir. "Bir LLM çağırması ne kadar tutar?" sorusunun cevabı her zaman token'lar üzerinden hesaplanır.

Token nedir?#

Bir karakter, bir kelime veya bir kelime parçası — modele göre değişir. Pratik tahmin:
  • İngilizce: 1 token ≈ 0.75 kelime ≈ 4 karakter
  • Türkçe: 1 token ≈ 0.4-0.6 kelime — Türkçe morfolojisi yüzünden 2-3x daha fazla token tüketir (Modül 6'da derin)
  • Kod: 1 token ≈ 3-4 karakter (BPE token'ları)

İstek başına maliyet formülü#

``` maliyet = (input_token / 1M × input_fiyat) + (output_token / 1M × output_fiyat) ```
Örnek: GPT-5'e 2000 input token + 500 output token istek: ``` maliyet = (2000 / 1_000_000 × 1.25)+(500/1000000×1.25) + (500 / 1_000_000 × 10.00) = 0.0025+0.0025 + 0.005 = $0.0075 ≈ 0.75 cent ```
Ucuz görünüyor — ta ki günde 10.000 istek yapana kadar. O zaman: 75/gu¨n×30=75/gün × 30 = **2,250/ay**.
python
# Maliyet hesaplayıcı — her API çağrısında yaz
PRICING = {
# (input_per_1M, output_per_1M) USD
"gpt-5": (1.25, 10.00),
"gpt-5-mini": (0.25, 2.00),
"gpt-5-nano": (0.05, 0.40),
"o3": (15.00, 60.00),
"o3-mini": (1.10, 4.40),
"gpt-4o": (2.50, 10.00),
"claude-opus": (15.00, 75.00),
"claude-sonnet": (3.00, 15.00),
"claude-haiku": (0.80, 4.00),
"llama-70b-tg": (0.88, 0.88), # Together
"qwen-72b-tg": (1.20, 1.20),
}
 
def cost(model: str, input_tokens: int, output_tokens: int) -> float:
inp, out = PRICING[model]
return (input_tokens / 1_000_000) * inp + (output_tokens / 1_000_000) * out
 
# Senaryo: kursta her gün ortalama 50 istek, ortalama 1500 input + 300 output token
daily = 50 * (cost("gpt-5-mini", 1500, 300))
monthly = daily * 30
yearly = monthly * 12
print(f"Günlük: ${daily:.4f}")
print(f"Aylık: ${monthly:.2f}")
print(f"Yıllık: ${yearly:.2f}")
Hızlı maliyet hesaplayıcı — kursta yararlı.

Kursun 8 Aylık Tahmini Maliyeti#

Üç farklı kullanım profilinde toplam maliyeti hesaplayalım. Tüm maliyetler kullandığın kadar ödeme şeklinde, ücretsiz kredilerden sonra.

Senaryo A — Tutumlu Öğrenci ($30-80 / 8 ay)#

KalemMaliyet
Modal Labs (kredi: $30/ay × 8)$0 (kredi yetiyor)
OpenAI (eval'ler için, sınırlı)$10
Anthropic (eval'ler için, sınırlı)$5 (yeni hesap kredisi)
Together AI (open-source baseline)$5 (kredi yetiyor)
Colab Pro (Modül 17-25 için 2 ay)$20
Diğer (HF dataset push'leri)$0
Toplam~$30-40
Strateji: Capstone'larda büyük modeller için tamamen Modal kredisi + Together'in kredisi. OpenAI/Anthropic kullanımı minimum.

Senaryo B — Dengeli Çalışan ($150-300 / 8 ay)#

KalemMaliyet
Modal (kredi + ek $20/ay × 4 ay)$80
OpenAI ($15/ay × 8)$120
Anthropic ($10/ay × 6)$60
Together (open-source inference)$20
Runpod (2 ağır capstone, $5/ay)$40
Colab Pro (8 ay)$80
Toplam~$200-300
Strateji: Eval ve karşılaştırmalarda kapalı modeller; capstone'larda Runpod RTX 4090.

Senaryo C — Profesyonel Yatırım ($500-1000 / 8 ay)#

KalemMaliyet
OpenAI ($40/ay × 8)$320
Anthropic ($30/ay × 8)$240
Modal ($50/ay × 8 + kredi)$200
Runpod (büyük fine-tune'lar, H100)$150
Together (sık inference)$50
Vector DB (Qdrant Cloud)$40
Langfuse Cloud$50
Toplam~$750-1050
Strateji: Tam paket — hiçbir limit, her capstone production-grade. Genelde freelance/şirket sponsorlu öğrenciler için.
💡 Gerçekçi öneri
Senaryo A ile başla. Modül 10'da bütçeni gözden geçir. İhtiyaç hissedersen B'ye yükselt. Sadece derin pre-training capstone'u (C1) yapacaksan C'ye çıkacaksın — başka şartlar yok.

Maliyet Tasarrufu Taktikleri#

Aynı çıktıyı %50-90 az maliyete elde etmenin pratikleri:
Geliştirme/test sırasında GPT-5-nano (0.05/0.05/0.40) veya Claude Haiku (0.80/0.80/4) kullan. Mantık çalıştığında, son testte/production'da büyük modele geç. Tipik tasarruf: %80-95.
import os MODEL = "gpt-5-nano" if os.environ.get("ENV") == "dev" else "gpt-5"

AI Mühendisinin Etik Sözleşmesi#

LLM mühendisliği, dünyayı önemli ölçüde etkileyen bir meslek. Yazdığın kod milyonlarca insanın gördüğü içeriği, aldığı tavsiyeyi, hatta verilen kararı etkileyebiliyor. Bu yüzden bir etik sözleşme — kendine ve mesleğe — şart.
Aşağıdaki 7 madde, bu kurs boyunca taahhüt edeceğin sözleşmedir. Her capstone'unu, her API çağrını, her veri kullanımını bu maddeler süzgecinden geçir.
Taahhüdüm: Eğitim/fine-tune veri seti olarak kullandığım veriler için (1) lisansı kontrol ederim, (2) public domain veya açık-kaynak lisansı tercih ederim, (3) crawlled içerik için robots.txt + ToS kontrolü yaparım, (4) kişisel veri (PII) içeren veriyi redacted halde kullanırım.
Pratik:
  • Common Crawl, Wikipedia, FineWeb-Edu → kullanabilirsin (lisans uygun)
  • Kitap, akademik makale, lisanslı gazete → dikkat: çoğunlukla yasak
  • Twitter/Reddit scrape → 2024'ten beri ToS değişti — sözleşmeyi kontrol et
  • Kendi şirketinin müşteri verisi → KVKK + sözleşme kontrolü zorunlu
EU AI Act'in getirdiği yenilik: Foundation model'in eğitildiği telif kaynaklı verinin public summary'sini yayınlamak gerekiyor (yüksek-risk modeller için).
✍️ Etik sözleşmeyi 'imzala'
Bu 7 maddeyi okuduktan sonra zihninde imzala. Çoğu LLM mühendisi bu maddeleri çok geç öğreniyor — başlangıçtan 'biliyorum + uygulayacağım' yaklaşımı, sektörün ahlakını yükseltir. Sen bu kursun mezunusun → standardı sen koyuyorsun.

Etik İkilemler — 3 Senaryo#

Soyut ilkeleri pratik hale getirmek için üç gerçek senaryo:
Durum: Bir e-ticaret şirketi seninle anlaştı. "Rakiplerimizin sitelerinden ürün açıklamaları çekip kendi LLM'imizi eğitmek istiyoruz" diyor.
Hangi maddeler tetikleniyor?
  • Madde 1 (Telif): Rakip sitelerin ToS'unda muhtemelen scraping yasak. İçerik telifli.
  • Madde 7 (Zarar): Tarafların ticari rekabeti bozulur, hukuki risk.
Etik karar: Reddet ya da scope daralt — sadece public spec data (üretici sitesi, kamuya açık), kendi ürün açıklamaların, lisanslı veri. Müşteriye risk haritasını açıkça sun.
Pratik yanıt müşteriye: "Bu yöntemin hukuki risk var (telif + ToS ihlali). Alternatif: kendi ürün veritabanınızı + üretici resmi veri + sentetik veri ile eğitim. Maliyeti karşılaştırıyorum, geri dönerim."

AI'ın Geleceği ve Sen#

Bu kursu bitirenler 2026-2030 arasında AI ürünleri tasarlayacak. Bu, toplumsal etkisi olan bir konum. Karpathy şöyle özetliyor:
"Bir AI mühendisi, internet'in 1995'teki yazılımcısı gibidir. Yarın internet'in nasıl çalışacağına bugün karar veriyorsun."
Sen bu kursu bitirdikten 6 ay sonra, bir karar masasında olacaksın. Önemli olan: karar verecek olgunlukla orada bulunmak.

Modül 0 Geriye Bakış#

Modül 0'ı tamamladın 🎉. Hatırla:
  • 0.1: LLM Engineer kim, kariyer ladder
  • 0.2: Kursun 8 felsefe ilkesi, 76 modül mimarisi
  • 0.3: Atölye kurulumu (uv, PyTorch, CUDA, WSL2, Mac MPS, Triton, Nsight)
  • 0.4: 12 cloud hesabı, API key güvenliği, ücretsiz kredi avı
  • 0.5: Bu ders — bütçe, etik sözleşme
Çıkış kontrol listesi:
  • Python 3.11 + uv kurulu, sanity test geçti
  • PyTorch + CUDA/MPS çalışıyor
  • En az 4 cloud hesabım var (HF, OpenAI, Modal, Together)
  • .env
    şablonum hazır
  • OpenAI'da hard budget limit kurdum
  • Çalışma modumu seçtim (Deep Linear / Fast Skim / ...)
  • Etik sözleşmenin 7 maddesini okudum, zihinsel olarak imzaladım
  • Modül 1'e geçmeye hazırım
Hepsi tikli ise → Modül 1'e hoş geldin.
Modül 1: AI Engineer'ın Matematiksel Cephaneliği — lineer cebir, kalkulus, olasılık, optimizasyon, bilgi teorisi. 10 ders boyunca matematik temellerini PyTorch ile somutlaştıracağız. Pre-flight: NumPy temel hatırlama.

Sık Sorulan Sorular

Senaryo A, kursu **disiplinli** takip eden bir öğrenciye yeter — yani Modal kredisini sonuna kadar kullanan, kapalı modelleri sadece eval'de kullanan, capstone'larında open-source modelleri tercih eden biri için. Eğer 'her şeyi en iyisinden çalıştırmak' istiyorsan Senaryo B-C arasına çıkarsın. Geçmiş öğrencilerin gerçek ortalaması: $80-150 / 8 ay (Senaryo A-B arası).

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

İlgili İçerikler

Bağlantılı Pillar Konular

Bu yazının bağlandığı pillar konular