Skip to content

Cloud Account Atlas: HuggingFace, OpenAI, Anthropic, Together, Modal, Runpod, Lambda — Which One and Why?

An LLM engineer juggles 12+ cloud accounts over 8 months. Which one and why, pricing models, API key security, free credit hunting, multi-provider strategy, Türkiye-specific payment and tax practices.

Şükrü Yusuf KAYA
35 min read
Beginner
Cloud Hesaplar Atlası: HuggingFace, OpenAI, Anthropic, Together, Modal, Runpod, Lambda — Hangisi Niye?
☁️ Bu derste 12 cloud hesabını açacaksın
Kursun sonuna kadar şu hesapların hepsi kullanışlı olacak: HuggingFace, OpenAI, Anthropic, Together, Modal, Runpod, Lambda Labs, Google Colab, Replicate, Groq, OpenRouter, GitHub. Toplam ücretsiz kredi: $400+ (doğru başvurularla). Bu dersi bitirince hepsinin API anahtarları .env dosyanda, güvenli şekilde, bütçe alarmları kurulu olacak.

Neden Bu Kadar Çok Sağlayıcı?#

LLM mühendisliği, dağıtık ekonomidir. Hiçbir tek sağlayıcı her senaryoda en iyisi değil:
İhtiyaçEn İyi Sağlayıcı(lar)Neden?
Model + Dataset hubHuggingFaceSektör standardı, ücretsiz, açık-kaynak
En kaliteli closed LLMOpenAI (GPT-5, o3), Anthropic (Claude)Frontier kalitesi, agentic, multimodal
Open-source LLM inferenceTogether, Fireworks, GroqLlama, Qwen, Mistral'ı 5-10x ucuza çalıştırıyor
Hızlı inferenceGroq (LPU), Cerebras (WSE)Token/saniye'de OpenAI'ye 10x üstün
Serverless GPUModal, Replicate, BeamSunucu yönetme yok, kullandığın kadar
Bare-metal GPU kiralamaRunpod, Lambda, Vast.aiPre-training/big fine-tune için saatlik H100
Reserved GPULambda, CoreWeaveUzun süreli projelerde %40 indirim
Ücretsiz GPU (kısıtlı)Google Colab, KaggleHızlı deneme, eğitim
Aggregated APIOpenRouter200+ modeli tek API anahtarı
Vector DBPinecone, Qdrant Cloud, WeaviateRAG için
ObservabilityLangfuse, Helicone, PhoenixLogs, traces, metrics
Önemli prensip: Bir LLM Engineer asla tek sağlayıcıya kilitlenmez. Senin işin "doğru iş için doğru araç". Bu derste ana 8 sağlayıcıyı detaylı işleyeceğiz.
LLM cloud ekosistemi 2026 — sağlayıcı haritası.
Sağlayıcı haritası: Model Hub, LLM API, Inference, Compute, Observability katmanları.

8 Ana Sağlayıcı Derinlemesine#

Her sağlayıcı için 6 başlık altında bakacağız:
  1. Ne için? (kullanım senaryoları)
  2. Pricing modeli
  3. Ücretsiz kredi / tier
  4. Türkiye'den ödeme
  5. API key alma + güvenlik
  6. Yaygın gotcha'lar
Ne için? Model indirme/yükleme (Llama, Qwen, BERT, ...), dataset, Spaces (Gradio app hosting), Inference Endpoints (serverless), AutoTrain, transformers/datasets/peft/trl kütüphanelerinin evi.
Bu kursta: Her capstone'un model çıktısı HuggingFace Hub'a yüklenecek. Datasetler de.
Pricing:
  • Free tier: Sınırsız public model/dataset upload. Spaces 16GB RAM, 2 CPU ücretsiz (CPU-only).
  • **PRO (9/ay):Privaterepossınırsız,SpacesGPU(T4)saatliku¨cretli( 9/ay):** Private repos sınırsız, Spaces GPU (T4) saatlik ücretli (~0.60/saat), priority support, dataset viewer hızlı.
  • Enterprise: Özel CDN, audit log, SAML SSO.
Inference Endpoints ücretleri (saatlik, GPU üzerinden):
GPU$/saatİdeal kullanım
CPU (4 vCPU)$0.06Embedding, küçük model
T4 (16GB)$0.607B FP16, küçük inference
L4 (24GB)$0.8013B Q4, daha hızlı
A10G (24GB)$1.3013B FP16
A100 40GB$4.0030-40B Q4, multi-LoRA
A100 80GB$6.5070B Q4, fine-tune
Ücretsiz kredi: Yeni hesap için yok. Ama "Inference API" (serverless, kotalı) — saatte ~30 istek ücretsiz.
Türkiye'den ödeme: USD, Visa/Mastercard kabul. KVK Visa Premium çalışıyor; iş bankası ihracat kontrolüne takılırsa banka ile aç. PayPal opsiyonel.
API key: huggingface.co/settings/tokens → "New token" →
read
veya
write
veya
fine-grained
(scoped). Token'ı asla repo'ya commit etme — .env'e ya da
huggingface-cli login
ile keyring'e.
Gotcha'lar:
  • Llama 3.3 ve bazı modeller için "License accept" gerekli. Hesap → Settings → Gated repos.
  • huggingface-cli
    çağrılarında
    HF_HOME
    ortam değişkeni cache lokasyonunu kontrol eder.
  • Spaces GPU'su kullanmadığında otomatik durur ama uyandırma 30-60 saniye sürer (cold start).
  • Model upload sırasında
    Git LFS
    lazım:
    git lfs install
    unutma.
bash
# HuggingFace CLI ile login (token'ı keyring'e güvenli saklar)
uv pip install huggingface_hub
huggingface-cli login
# Token'ı yapıştır → ENTER
 
# Test
huggingface-cli whoami
# Senin kullanıcı adın
 
# Bir modeli indir (gated değilse)
huggingface-cli download Qwen/Qwen2.5-7B-Instruct --local-dir ./models/qwen-7b
HuggingFace login + ilk model indirme.
python
# .env
# OPENAI_API_KEY=sk-...
 
# Python
import os
from openai import OpenAI
 
client = OpenAI(api_key=os.environ["OPENAI_API_KEY"])
 
resp = client.chat.completions.create(
model="gpt-5-mini",
messages=[{"role": "user", "content": "Bir LLM Engineer'ın 3 günlük rutinini özetle."}],
max_tokens=300,
)
print(resp.choices[0].message.content)
print(f"Maliyet (tahmini): ${(resp.usage.prompt_tokens * 0.25 + resp.usage.completion_tokens * 2.00) / 1_000_000:.6f}")
OpenAI API'sini ilk kullanım — maliyeti hesaplı.
python
# Together AI — OpenAI uyumlu
from openai import OpenAI
import os
 
client = OpenAI(
api_key=os.environ["TOGETHER_API_KEY"],
base_url="https://api.together.xyz/v1",
)
 
resp = client.chat.completions.create(
model="meta-llama/Llama-3.3-70B-Instruct-Turbo",
messages=[{"role": "user", "content": "1+1 kaç eder?"}],
)
print(resp.choices[0].message.content)
# Maliyet: GPT-5'in ~%10'u
Together AI — OpenAI uyumlu, sadece base_url değiştir.
python
# llama_inference.py — Modal'da H100'de Llama 3.3 70B çalıştır
import modal
 
image = (
modal.Image.debian_slim()
.pip_install("vllm==0.6.4", "huggingface_hub")
.env({"HF_HUB_ENABLE_HF_TRANSFER": "1"})
)
 
app = modal.App("llm-muh-llama-70b")
 
@app.function(
image=image,
gpu="H100",
timeout=600,
secrets=[modal.Secret.from_name("hf-token")],
)
def generate(prompt: str) -> str:
from vllm import LLM, SamplingParams
llm = LLM(
model="meta-llama/Llama-3.3-70B-Instruct",
quantization="awq",
max_model_len=4096,
)
out = llm.generate([prompt], SamplingParams(max_tokens=200))
return out[0].outputs[0].text
 
@app.local_entrypoint()
def main():
print(generate.remote("LLM mühendisliği nedir?"))
 
# Kullanım:
# $ modal run llama_inference.py
# H100 üzerinde Llama 70B AWQ ile inference — toplam maliyet ~$0.20
Modal ile 5 dakikada Llama 70B serverless inference.

Diğer Önemli Sağlayıcılar (kısa)#

  • Replicate — Model deployment, "predict.replicate.com" API ile. Yaratıcı use case'lerde popüler.
  • Groq — LPU (Language Processing Unit), Llama 3.3'ü saniyede 500+ token üretiyor. Llama API ücretsiz tier var, hızlı.
  • Cerebras Inference — WSE chip, en hızlısı.
    cerebras.ai
    70B'yi 1000 t/s üretebiliyor.
  • Fireworks AI — Open-source LLM serving, Together AI rakibi. Fonksiyon çağırma + serverless fine-tune.
  • OpenRouter — 200+ modeli tek API. OpenAI, Anthropic, Together, Fireworks, Mistral, vb. üzerinden route ediyor. Geliştirme için süper.
  • Mistral La Plateforme — Mistral'ın kendi API'si (Codestral, Mistral Large).
  • Vast.ai — Pikamine/Bitcoin tarzı GPU marketplace, çok ucuz ama kararlılığı belirsiz.
  • CoreWeave / Crusoe / Lambda Cluster — Enterprise/scale-up cluster sağlayıcıları.
  • Vercel AI SDK — Frontend deployment + LLM stream (Next.js dünyası).

Senaryo Bazlı Karar Matrisi#

"Bu senaryoda hangi sağlayıcı?" tablosu:
Senaryomİlk TercihYedekNeden
GPT-4 alternatifi ihtiyacım var, ekonomikTogether (Llama 3.3 70B)Fireworks%90 ucuz, açık-kaynak
Coding agent yapacağımClaude 4.7 SonnetGPT-5Coding benchmark'ında üstün
Saniyede 500+ token lazım (chat UX)GroqCerebrasLPU hızı
Bir 7B modeli fine-tune edeceğimModal (H100, $4.56/saat)Together Fine-TuneLoRA için 2 saat = $10
70B modeli pretrain'e devam edeceğimLambda (reserved)Runpod SecureStabilite
Gradio demo paylaşacağımHuggingFace SpacesModalTek tıkla paylaşım
RAG için embeddingOpenAI text-embedding-3-smallVoyage-3Kalite/maliyet
Multimodal görsel anlamaGPT-5 + Claude 4.7Qwen-VL on TogetherKapalı modeller hâlâ üstün
Türkçe konuşma (sesli)OpenAI RealtimeElevenLabs + LLMLatency
Üretim sunucusunda modelvLLM on RunpodModalSelf-hosted ekonomi

API Anahtarı Güvenliği — Profesyonel Hijyen#

API key'lerini güvensiz tutmak yaygın bir hata. 2024'te bir GitHub leak'iyle bir startup'ın OpenAI hesabı $48,000 faturayla bitmişti. Senin böyle bir hikayen olmaması için 6 kural:
Yanlış:
client = OpenAI(api_key="sk-proj-abc123...") # ❌ kodda hardcoded
Doğru:
import os client = OpenAI(api_key=os.environ["OPENAI_API_KEY"]) # ✓ env'den
.env
dosyasını ASLA commit etme.
.gitignore
'a ekle.
git-secrets: Bir araç kur ki kaza ile commit edemeyesin:
brew install git-secrets
veya
pip install detect-secrets
. Pre-commit hook'unda çalışır.
bash
# .env (örnek şablon — kursta kullanacağın anahtarlar)
# 🔒 BU DOSYAYI GIT'E COMMIT ETME — .gitignore'da olmalı
 
# === Model Hub ===
HF_TOKEN=hf_...
 
# === Closed LLM API ===
OPENAI_API_KEY=sk-proj-...
ANTHROPIC_API_KEY=sk-ant-...
 
# === Open-source LLM Inference ===
TOGETHER_API_KEY=...
FIREWORKS_API_KEY=...
GROQ_API_KEY=...
 
# === Compute ===
MODAL_TOKEN_ID=ak-...
MODAL_TOKEN_SECRET=as-...
RUNPOD_API_KEY=...
LAMBDA_API_KEY=...
 
# === Aggregator (geliştirme için pratik) ===
OPENROUTER_API_KEY=sk-or-...
 
# === Observability ===
LANGFUSE_PUBLIC_KEY=pk-lf-...
LANGFUSE_SECRET_KEY=sk-lf-...
LANGFUSE_HOST=https://cloud.langfuse.com
 
# === Vector DB (RAG capstone'da) ===
QDRANT_URL=https://...
QDRANT_API_KEY=...
PINECONE_API_KEY=...
 
# === Diğer ===
SERPER_API_KEY=... # Web search
TAVILY_API_KEY=... # Agentic search
Kursta kullanacağın tüm API anahtarları için .env şablonu.

Ücretsiz Kredi Avı: $400+ Toplama Rehberi#

Doğru başvurularla 8 ay boyunca neredeyse ücretsiz çalışabilirsin. İşte mevcut programlar (2026 başı, değişebilir — kontrol et):
ProgramKrediŞart
Anthropic API$5Telefon doğrulama
Together AI5+5 + 25 referralHesap aç + referral kullan
Modal Labs30/ay×12ay=30/ay × 12 ay = 360Hesap aç (otomatik)
Replicateİlk birkaç görsel/saniye ücretsizOtomatik
GroqSınırsız (kotalı)Hesap aç
Fireworks$1 ilk dakika içinOtomatik
OpenRouter$1 ücretsizHesap aç
GitHub Student Pack$200+ farklı krediÖğrencisen
Google Cloud$300 yeni hesapİlk 90 gün
AWS Activate$1000-100k (startup)Şirket kurulu
NVIDIA InceptionDLI kursları + hardware promoStartup'larda
Microsoft for Startups$150K AzureErken aşama startup
Lambda Labs Promo$500-2000 startupEmail atılarak
Toplam ulaşılabilir: 400800(o¨g˘renciolarak),400-800 (öğrenci olarak), 1000+ (startup kurmuşsan).
💡 Akıllı kredi yönetimi
Krediyi tasarruflu kullan — bittiği gün ek başvuru yok. Bu strateji: ilk ay sadece Modal (30)ilec\calıs\c.I˙kinciayTogetheridevreyeal.U¨c\cu¨ncu¨ayOpenAI/Anthropiciekbu¨tc\ceile.Lambda/Runpodusadececapstoneic\cin.Busırayla8ayboyuncacebinden30) ile çalış. İkinci ay Together'i devreye al. Üçüncü ay OpenAI/Anthropic'i ek bütçe ile. Lambda/Runpod'u sadece capstone için. Bu sırayla **8 ay boyunca cebinden 50-100** ile bu kursu bitirebilirsin.

Türkiye'den Ödeme: Pratik Notlar#

Cloud hesapların hepsi USD bazlı. Türkiye'den ödeme yaparken yaygın sorunlar ve çözümler:

🇹🇷 Banka kartı sorunları#

Sorun: "International transaction declined" hatası. Çözüm:
  1. Bankanı ara — "yurtdışı online ödemeleri" aktif et
  2. Garanti BBVA, Yapı Kredi, İş Bankası — genelde aktiftir
  3. Halkbank, Vakıfbank — bazen kısıtlı
  4. Premium kartlar (Worldcard, Maximum) daha rahat

💳 Dijital bankalar#

  • Wise — TR mobil app ile USD/EUR balance, sanal kart. Çoğu cloud kabul ediyor.
  • Revolut — bazı ülke kısıtları, TR'de 2025'te full erişim açıldı.
  • N26 (Almanya) — TR'de yaşayıp Avrupa kart isteyenler için.

🪙 Crypto opsiyonu#

Runpod, Vast.ai, bazı küçük sağlayıcılar USDC/USDT kabul ediyor. TR'de kraken/binance üzerinden USDC alıp doğrudan ödeme.

📑 Vergi/fatura#

Şirketin var ise yurtdışı yazılım/hizmet alımı stopaj + KDV2 muhasebe konusu. Bireysel hesap kullanıyorsan vergi yok ama gider olarak yazamazsın. Şirket için: SaaS faturalarını dikkatli sakla, mali müşavirinle paylaş.

Bu Derste Neler Öğrendik?#

8 ana sağlayıcı: HF, OpenAI, Anthropic, Together, Modal, Runpod, Lambda, Colab ✓ Pricing modelleri ve ücretsiz kredi olanakları ✓ Senaryo bazlı karar matrisi — hangi sağlayıcı niye ✓ API key güvenliği — 6 kural (no commit, .env, scoped, budget, rotation, secret manager) ✓ Türkiye'den ödeme pratikleri ve crypto/Wise alternatifleri ✓ $400+ ücretsiz kredi avı rehberi

Sıradaki Ders#

0.5 — Maliyet ve Etik Sözleşmesi Kursun toplam tahmini maliyeti (3 senaryo), token economics 101, AI mühendisinin etik sözleşmesi: telif, KVKK, EU AI Act, akademik dürüstlük, sürdürülebilirlik. Bu son ders Modül 0'ı tamamlıyor; Modül 1'e geçmeye hazır olacaksın.

Frequently Asked Questions

For Modules 0-5, HuggingFace + Modal + Colab suffice. For Module 6+, add at least one of OpenAI or Anthropic (for evals). For Module 13+, add Together AI. For Module 17+, Runpod or Lambda. We're not saying 'open them all today' — just get used to writing API keys in your .env template. Each takes ~5 minutes.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

Related Content