Stable Diffusion Yerel Kurulum 2026: Sıfırdan Profesyonel Türkçe Derin Rehber
Stable Diffusion yerel (lokal) kurulum için derin teknik rehber: GPU seçimi (NVIDIA, AMD, Apple M-series, Intel Arc), Windows/macOS/Linux platform-spesifik adımlar, 3 ana UI karşılaştırması (Automatic1111 olgun, ComfyUI profesyonel, Forge optimize, Fooocus basit, SD.Next gelişmiş), model dosyaları (SD 1.5, SDXL, SD 3.5, FLUX, Pony Diffusion), VAE setup, sampler (Euler a, DPM++ 2M Karras, UniPC) detaylı açıklama, CFG scale + denoising strength, LoRA + ControlNet + IP-Adapter kurulum, inpainting/outpainting workflow, CivitAI ekosistemi, Dreambooth/LoRA fine-tune, OOM/CUDA/Black image troubleshooting, performance optimization (xFormers, FlashAttention, torch.compile), KVKK self-host security, 25+ pratik tip.
Tek cümlelik cevap: Stable Diffusion yerel kurulum, RTX 3060+ donanım + Automatic1111/ComfyUI ile ücretsiz + KVKK %100 + sınırsız profesyonel görsel üretim sağlar.
- Stable Diffusion yerel kurulum, ücretsiz + KVKK %100 uyumlu + sınırsız üretim sunar — Türk şirketleri için Midjourney/DALL-E maliyetinin %1ine sektör-rakip görsel üretim mümkün.
- Üç ana UI: (1) Automatic1111 — en olgun, geniş eklenti, yeni başlayanlar için ideal (slider tabanlı). (2) ComfyUI — profesyonel node-based workflow, FLUX/SD3 native, daha hızlı. (3) Fooocus — basit, minimal config, sade kullanıcı için.
- Donanım minimum: NVIDIA GTX 1060 6GB (yavaş ama çalışır, SDXL Q4). Optimal: RTX 3060 12GB (SDXL native, $250-300). İdeal: RTX 4090 24GB (FLUX + SDXL hızlı, $1500-2000). Mac: M1+ Apple Silicon (yavaş ama çalışır, MLX/Diffusers).
- Model ekosistemi: SD 1.5 (Stable, 100K+ CivitAI fine-tune), SDXL (1024×1024 native), SD 3.5 (Stability community license), FLUX 1 (BFL non-commercial dev + Apache schnell), Pony Diffusion (anime), Illustrious (anime), Realistic Vision (photoreal SD 1.5 fine-tune).
- Anahtar parametre 5 tane: (1) Sampler (Euler a hızlı, DPM++ 2M Karras kaliteli, UniPC SD3+ için). (2) Steps (SD: 20-30, SDXL: 25-40, FLUX: 4-28). (3) CFG (SD: 6-9, SDXL: 5-7, FLUX: 3.5). (4) Resolution (SD 512×512, SDXL 1024×1024). (5) Seed (sabit = tekrarlanabilir).
- Profesyonel ekstra: LoRA (stil/karakter fine-tune), ControlNet (canny/depth/pose yapı kontrolü), IP-Adapter (referans stil), Inpainting (seçili alan), Hires Fix (upscale), Refiner (SDXL final pass).
- Türk şirket KVKK: Self-host SD = veri hiç dışarı çıkmaz. Banka/sağlık/savunma için tek doğru çözüm. RTX 4090 + ComfyUI iş yatırımı 6-12 ayda Midjourney/DALL-E maliyetinden tasarrufla amortize.
1. Giriş: Neden Yerel Kurulum?
Stable Diffusion'ın yerel kurulumu (lokal, self-host) AI görsel üretiminde dönüştürücü bir özelliktir. Midjourney/DALL-E/FLUX [pro] gibi bulut servislere karşı 5 stratejik avantaj sağlar:
| Boyut | Yerel SD | Bulut (Midjourney/DALL-E) |
|---|---|---|
| Görsel başına maliyet | ~₺0.10 elektrik | ₺1-3 |
| Aylık 5000 görsel maliyet | ~₺500 elektrik | ₺5000-15000 |
| KVKK uyum | %100 uyum (veri içeride) | Risk (yurt dışı transfer) |
| Sansür | Topluluk modelleri serbest | Sıkı (NSFW, ünlü, marka yasaklı) |
| Özelleştirme | LoRA + ControlNet + custom checkpoint | Çok sınırlı |
| Hız | Donanıma bağlı (5-60 sn) | Bulut latency (8-50 sn) |
| Üretim sınırı | YOK | Aylık quota / fair use |
| Internet bağımlılığı | YOK | Var |
| Lisans | Modele göre (çoğu MIT/Apache/CreativeML OpenRAIL) | Tier'a göre ticari sınır |
| Ekosistem | 100K+ CivitAI model + LoRA | Sınırlı |
2. Donanım Seçimi — Detaylı Karar Rehberi
2.1 NVIDIA GPU Hiyerarşisi
| GPU | VRAM | SDXL Hız | FLUX Hız | Fiyat (₺) | Notlar |
|---|---|---|---|---|---|
| GTX 1060 | 6GB | 60-90 sn | Çalışmaz | ₺2K (2.el) | Sadece SD 1.5 |
| GTX 1660 Super | 6GB | 45-70 sn | Çalışmaz | ₺3K | SD 1.5 OK |
| RTX 2060 | 6GB | 30-50 sn | NF4 (60 sn) | ₺4-5K | Eşik |
| RTX 3060 12GB | 12GB | 20-30 sn | Q4 (40 sn) | ₺8-9K | ÖNERILEN giriş |
| RTX 3070 | 8GB | 15-25 sn | NF4 (30 sn) | ₺9-11K | VRAM dar |
| RTX 3080 10GB | 10GB | 12-20 sn | NF4 (25 sn) | ₺12K (2.el) | İyi seçim |
| RTX 3090 24GB | 24GB | 8-15 sn | Q8 (15 sn) | ₺18-22K | FLUX full |
| RTX 4060 Ti 16GB | 16GB | 10-18 sn | Q8 (20 sn) | ₺13-15K | Modern dengeli |
| RTX 4070 | 12GB | 8-15 sn | Q4 (15 sn) | ₺18-20K | Modern hızlı |
| RTX 4070 Ti Super | 16GB | 6-12 sn | Q8 (12 sn) | ₺25-28K | Sweet spot |
| RTX 4080 | 16GB | 5-10 sn | Q8 (10 sn) | ₺35-40K | Premium |
| RTX 4090 | 24GB | 3-8 sn | FP16 (10 sn) | ₺55-65K | Lider tüketici |
| RTX 5090 | 32GB | 2-5 sn | FP16 (5 sn) | ₺85K+ | 2025 flagship |
2.2 Donanım Karar Akışı
| Senaryo | Önerilen GPU | Maliyet (₺) |
|---|---|---|
| Hobby + öğrenme | RTX 3060 12GB | 8-9K |
| Solo içerik üretici | RTX 4060 Ti 16GB | 13-15K |
| Yarı-pro freelance | RTX 4070 Ti Super | 25-28K |
| KOBİ kreatif takım | RTX 4090 | 55-65K |
| Stüdyo / agency | 2× RTX 4090 (paralel batch) | 110-130K |
| Kurumsal banka/sağlık | 1× A100 80GB | Custom (~₺500K+) |
2.3 AMD ve Intel GPU Durumu
AMD opsiyonu:
- Linux + ROCm 6.0+ + RX 7900 XTX 24GB ≈ RTX 4080 performans
- Windows: DirectML (yavaş) veya WSL2 + ROCm
Intel opsiyonu:
- Arc A770 16GB — Intel IPEX-LLM + diffusers
- 2025-2026'da olgunlaşıyor ama hala niche
2.4 Apple M-Series
Mac M1/M2/M3/M4 Pro/Max/Ultra:
- Native MLX framework veya Diffusers (PyTorch MPS backend)
- Performans: M3 Max 64GB ≈ RTX 3070 hızında
- Avantaj: Sessiz, düşük güç, taşınabilir
- Dezavantaj: ControlNet/LoRA bazıları MPS'te uyumsuz
Mac için önerilen: M3 Max 36GB+ veya M3 Ultra 48GB+. Apple Silicon SD için Draw Things uygulaması veya ComfyUI MLX nightly.
2.5 Bütçe Olmadan Başlangıç — Cloud Alternatifleri
Bu rehber yerel kurulum için olsa da, donanım yokken başlangıç için:
- Google Colab Free (sınırlı GPU, T4 16GB, oturum başı 4 saat)
- Kaggle Notebooks (T4×2, haftalık 30 saat)
- Runpod / Vast.ai / TensorDock ($0.20-0.50/saat RTX 4090)
- CivitAI Generator (web tabanlı, ücretsiz tier)
Bu cloud GPU yaklaşımları 6-12 ay denenip donanım yatırımı kararı verilebilir.
3. Üç Ana UI Detaylı Karşılaştırması
3.1 Automatic1111 (Stable Diffusion WebUI)
- Automatic1111
- AUTOMATIC1111/stable-diffusion-webui GitHub repository'sinin yaygın adı. 2022'den beri en yaygın kullanılan SD UI. Gradio tabanlı web arayüzü. Slider/dropdown ile parametreler. 5000+ eklenti, geniş topluluk. SD 1.5 ve SDXL için olgun; SD 3.5 ve FLUX için yavaş güncelleme.
Güçlü yönler:
- En geniş topluluk, en çok tutorial
- Eklenti ekosistemi mükemmel (ControlNet, ADetailer, Regional Prompter, vb.)
- Slider tabanlı UI yeni başlayanlar için kolay
- SD 1.5/SDXL/Pony için olgun
Zayıf yönler:
- FLUX desteği geriden geliyor
- ComfyUI'den daha yavaş (5-20%)
- SD 3.5 destek geriden
- Workflow ihracı sınırlı
Kim için uygun:
- Yeni başlayan SD kullanıcısı
- SD 1.5 / SDXL ile çalışacak
- Tutorial bolca isteyen
3.2 ComfyUI
- ComfyUI
- ComfyAnonymous tarafından 2023'te yayınlanan, node-based workflow ile çalışan ileri seviye Stable Diffusion UI. Each step a node, akış görsel olarak tasarlanır. Profesyonel kullanım için en güçlü UI. FLUX, SD 3.5, video gen ilk olarak burada destek bulur. 2026'da sektör standardı oldu.
Güçlü yönler:
- En hızlı UI (memory + speed optimize)
- FLUX, SD 3.5, Video Diffusion ilk burada
- Node-based workflow = repeatable + paylaşılabilir
- Memory efficient (low VRAM çalışır)
- Custom node ekosistemi geniş
Zayıf yönler:
- Öğrenme eğrisi yüksek (node-based mantık)
- Yeni başlayan için göz korkutucu
- A1111'in bazı eklentilerinin eşdeğeri yok
Kim için uygun:
- Profesyonel kullanıcı
- FLUX/SD 3.5 öncelik
- Workflow paylaşımı yapan ekip
3.3 Forge UI (Stable Diffusion Webui Forge)
A1111'in lllyasviel tarafından optimize edilmiş fork'u:
- A1111'in aynı UX'i + ComfyUI hızı
- VRAM management iyileştirilmiş
- FLUX desteği A1111'den daha hızlı geldi
3.4 Fooocus
lllyasviel tarafından yapılan, minimal config gerektirmesini hedefleyen UI:
- Sadece prompt yaz → görsel üret
- Otomatik en iyi sampler/CFG/steps seçimi
- Tek tık install
- SD/SDXL focus, FLUX yok (Şubat 2026)
Kim için uygun: Geliştirici olmayan + hızlı görsel isteyen kullanıcılar.
3.5 SD.Next (vladmandic)
Gelişmiş A1111 fork — Diffusers backend, daha fazla model desteği (SD/SDXL/SD3/Cascade/FLUX/Lumina/PixArt). Power user için.
3.6 InvokeAI
Profesyonel/kurumsal tier SD UI — kendi server architecture, Apache 2.0, kurumsal kullanım için optimize.
3.7 UI Karar Matrisi
| Kullanıcı Profili | Tavsiye |
|---|---|
| Yeni başlayan + SD 1.5/SDXL | Automatic1111 |
| Geliştirici olmayan + hızlı | Fooocus |
| Profesyonel + FLUX/SD3 | ComfyUI |
| A1111 alışkın + hız | Forge UI |
| Power user + multi-model | SD.Next |
| Kurumsal | InvokeAI |
| Mac M-series | Draw Things veya ComfyUI |
4. Adım Adım Kurulum — Automatic1111 Windows
4.1 Önkoşullar
A1111 Kurulum Önkoşulları (Windows 10/11)
- 1
Python 3.10.6 kur
python.org/downloads/release/python-3106 → Windows installer (64-bit). Kurulum sırasında 'Add Python to PATH' İŞARETLE.
- 2
Git kur
git-scm.com/download/win → Windows installer, varsayılan ayarlar.
- 3
NVIDIA driver güncel mi?
nvidia.com/Download/index.aspx → Studio Driver (en güncel). Kurulum sonrası reboot.
- 4
CUDA Toolkit (opsiyonel ama önerilir)
CUDA 12.1+ — developer.nvidia.com/cuda-downloads → Windows local installer.
4.2 A1111 İndirme ve Kurulum
Automatic1111 Kurulum
- 1
Repo clone
Boş klasörde (örn C:\AI\) PowerShell: git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
- 2
Model indir (SD 1.5 başlangıç)
huggingface.co/runwayml/stable-diffusion-v1-5 → v1-5-pruned.safetensors (4.2GB) → stable-diffusion-webui/models/Stable-diffusion/
- 3
İlk çalıştır
stable-diffusion-webui klasöründe webui-user.bat çift tık. PyTorch + Diffusers otomatik kurulur (~10-20 dakika ilk seferde).
- 4
Browser
Otomatik tarayıcı açılır: 127.0.0.1:7860
- 5
İlk prompt
Prompt kutusuna: 'a cat sitting in a Turkish garden, warm sunset light, photographic'. Generate. ~20-30 sn (RTX 3060) sonra ilk görsel.
4.3 Optimization Flag'ler (webui-user.bat)
webui-user.bat dosyasını NotePad ile aç, COMMANDLINE_ARGS satırına ekle:
| Flag | İşlev |
|---|---|
| --xformers | xFormers memory-efficient attention (önerilir) |
| --medvram | 12GB altı VRAM için |
| --lowvram | 6-8GB VRAM için (yavaş) |
| --no-half | Sayısal sorun varsa (yavaş) |
| --opt-sdp-attention | PyTorch 2.0+ scaled dot-product attention |
| --upcast-sampling | Bazı GPU'larda kalite + stabil |
| --api | REST API endpoint aktif (otomasyon için) |
| --listen | Network içinde başkalarına aç |
| --share | Gradio public share (DİKKAT — public) |
Tipik power user flag: COMMANDLINE_ARGS=--xformers --opt-sdp-attention --api
4.4 macOS Apple Silicon
A1111 Mac M-series Kurulum
- 1
Homebrew kur
Terminal: /bin/bash -c $(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)
- 2
Dependencies
brew install cmake protobuf rust python@3.10 git wget
- 3
A1111 clone
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git ~/stable-diffusion-webui
- 4
Model indir
v1-5-pruned.safetensors → ~/stable-diffusion-webui/models/Stable-diffusion/
- 5
Çalıştır
cd ~/stable-diffusion-webui && ./webui.sh
- 6
Mac-specific args
Flag ekle: --no-half --use-cpu interrogate (M1/M2 için, M3+'ta gerek yok)
4.5 Linux Ubuntu
A1111 Ubuntu 22.04 Kurulum
- 1
Dependencies
sudo apt update && sudo apt install -y python3.10 python3.10-venv python3-pip git curl
- 2
NVIDIA driver
sudo ubuntu-drivers autoinstall && reboot
- 3
CUDA
NVIDIA resmi CUDA repo'dan en son sürüm kurulum
- 4
A1111
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git && cd stable-diffusion-webui
- 5
Model
Yukarıdaki gibi model dosyasını models/Stable-diffusion/ koy
- 6
Çalıştır
./webui.sh — otomatik venv + pip install
5. ComfyUI Kurulum — Profesyonel Yol
5.1 Windows Portable
ComfyUI Windows Portable Kurulum
- 1
İndir
github.com/comfyanonymous/ComfyUI/releases → ComfyUI_windows_portable.7z (~1.5GB)
- 2
7-Zip ile çıkart
C:\AI\ComfyUI_windows_portable\
- 3
Manager kur (zorunlu)
PowerShell: cd C:\AI\ComfyUI_windows_portable\ComfyUI\custom_nodes && git clone https://github.com/ltdrdata/ComfyUI-Manager
- 4
Model yerleştir
v1-5-pruned.safetensors → ComfyUI\models\checkpoints\
- 5
Çalıştır
run_nvidia_gpu.bat çift tık. Browser otomatik: 127.0.0.1:8188
- 6
Default workflow
Drag-drop: github.com/comfyanonymous/ComfyUI_examples/blob/master/sd_basic/workflow.json
5.2 ComfyUI Node-Based Workflow Mantığı
ComfyUI'da her görsel üretim adımı bir node olarak temsil edilir:
- Load Checkpoint node: Model dosyasını yükle
- CLIP Text Encode node: Prompt'u embedding'e çevir (positive + negative)
- Empty Latent Image node: Boş canvas hazırla (512×512 veya 1024×1024)
- KSampler node: Diffusion sampling (steps, CFG, sampler, seed)
- VAE Decode node: Latent'ı pixel'e çevir
- Save Image node: Kaydet
Tüm bu node'lar oklar ile birleştirilir. Bir kez kurduğun workflow JSON olarak kaydedilip paylaşılabilir.
6. Model Ekosistemi — Hangi Checkpoint?
6.1 Ana Model Aileleri
| Model | Çıkış | Çözünürlük | Boyut | Özellik |
|---|---|---|---|---|
| SD 1.5 | Ekim 2022 | 512×512 | 4GB | 100K+ fine-tune |
| SD 2.1 | Aralık 2022 | 768×768 | 5GB | Az kullanılır |
| SDXL 1.0 | Temmuz 2023 | 1024×1024 | 6.6GB | Geniş benimsenme |
| SDXL Turbo | Kasım 2023 | 512×512 | 6GB | 1-step fast |
| SD 3.0 / 3.5 | 2024 | 1024×1024 | 8GB+ | Yeni mimari, daha sıkı lisans |
| SD 3.5 Large | Ekim 2024 | 1024×1024 | 16GB | MMDiT mimari, 8B param |
| FLUX.1 Schnell | Ağu 2024 | 1024×1024 | 23.8GB | Apache 2.0 ticari |
| FLUX.1 Dev | Ağu 2024 | 1024×1024 | 23.8GB | Non-commercial |
| Stable Cascade | Şubat 2024 | 1024×1024 | 6GB | Hızlı, az kullanılır |
6.2 Popüler Fine-Tune'lar (Topluluk)
| Model | Base | Stil | Kullanım |
|---|---|---|---|
| Realistic Vision | SD 1.5 | Photoreal | Portre + insan |
| DreamShaper | SD 1.5/SDXL | Genel | Çok yönlü |
| Juggernaut XL | SDXL | Photoreal | Profesyonel kalite |
| Pony Diffusion V6 | SDXL | Anime + cartoon | NSFW + non-NSFW |
| Illustrious XL | SDXL | Anime | Modern anime |
| Animagine XL | SDXL | Anime | NSFW anime |
| NoobAI-XL | SDXL | Anime | Yeni 2025 |
| Reliberate | SD 1.5 | Photoreal | Sanatsal photoreal |
| epicRealism | SD 1.5 | Photoreal | Foto detay |
| Counterfeit | SD 1.5 | Anime | Eski klasik |
| CyberRealistic | SD 1.5 | Photoreal | Sci-fi + portre |
İndirme: civitai.com (Türkçe arayüz yok ama dosya indirme basit).
6.3 VAE — Variational Autoencoder
VAE renk kalitesi ve görsel kontrastta kritik:
- SD 1.5: VAE genelde checkpoint'a entegre. "ft-mse-840000-ema-pruned" external VAE renkleri iyileştirir
- SDXL: sdxl_vae.safetensors (Stability resmi) zorunlu
- FLUX: ae.safetensors (BFL official) zorunlu
VAE konumu: models/VAE/ klasörü. A1111 Settings'te varsayılan VAE seçimi.
7. Anahtar Parametreler Detaylı
7.1 Sampler — Hangisini Seçmeli?
| Sampler | Step | Kalite | Hız | Use-Case |
|---|---|---|---|---|
| Euler a | 20-25 | İyi | Hızlı | Hızlı prototip |
| Euler | 20-30 | İyi | Hızlı | Klasik |
| DPM++ 2M Karras | 20-30 | ÇOK İYİ | Orta | ÖNERILEN default SD 1.5/SDXL |
| DPM++ 3M SDE | 30-50 | En iyi | Yavaş | High quality |
| DPM++ SDE Karras | 20-30 | Çok iyi | Orta | Detay |
| UniPC | 10-20 | İyi | Çok hızlı | SD 3.5 default |
| LCM | 4-8 | Orta | Çok hızlı | LCM LoRA ile |
| DDIM | 30-50 | Orta | Orta | Reproducible |
| Heun | 20-30 | Çok iyi | Yavaş | Detay |
| PLMS | 20-30 | Orta | Hızlı | Eski klasik |
Pratik tavsiye:
- SD 1.5 / SDXL: DPM++ 2M Karras 25 step
- SD 3.5 / FLUX: UniPC 28 step veya Euler 28 step
- LCM LoRA ile: LCM 4-8 step (hızlı)
7.2 CFG Scale (Classifier-Free Guidance)
CFG = prompt'a ne kadar sıkı bağlı kalsın:
| CFG | Davranış |
|---|---|
| 1-2 | Prompt çok serbest, AI yaratıcılık üst |
| 3-4 | Hafif prompt-following, yaratıcı |
| 6-8 | Önerilen SD 1.5/SDXL sweet spot |
| 7-9 | Sıkı prompt, ama bazen aşırı doygun renk |
| 10+ | Çok sıkı, görsel yanmış/aşırı saturated |
Pratik:
- SDXL: CFG 5-7
- SD 1.5: CFG 7-9
- FLUX: CFG 3.5 (Schnell: 0 — yok)
- SD 3.5: CFG 3.5-7
7.3 Steps (Sampling Step Sayısı)
Step ne kadar yüksek = daha rafine ama yavaş + diminishing returns:
- 10 step: Yarı-bozuk, hızlı denemeler
- 20 step: Kabul edilebilir
- 25-30 step: Sweet spot
- 50 step: Üst sınır
- 100+ step: Boşa GPU (kalite artmaz)
7.4 Resolution — Çözünürlük Tuzakları
7.5 Seed — Tekrarlanabilirlik
Seed = aynı seed + aynı parametre + aynı prompt → aynı görsel.
Kullanım:
- Test: Seed sabit, prompt değişikliği etkisini izlemek
- Iteration: Beğenilen görselin seed'ini al, prompt rafine et
- Production: Seed -1 (random) — her seferinde farklı varyant
8. LoRA, ControlNet, IP-Adapter — İleri Özellikler
8.1 LoRA (Low-Rank Adaptation)
- LoRA
- Low-Rank Adaptation. Tam fine-tune yerine küçük 'adapter' dosyalar (genelde 50-300MB). Çekirdek modeli değiştirmeden yeni stil/karakter ekler. Birden çok LoRA aynı anda kullanılabilir. CivitAI'de 50K+ LoRA mevcut.
LoRA kurulumu:
- LoRA dosyalarını
models/Lora/klasörüne koy - A1111: prompt'a
<lora:loraadi:0.8>ekle (0.8 = strength) - ComfyUI: "Load LoRA" node ekle
Popüler LoRA kategorileri:
- Karakter LoRA (belirli karakter tutarlılığı)
- Stil LoRA (Studio Ghibli, Pixar, Van Gogh)
- Konsept LoRA (örn cyberpunk, fantasy)
- Detail LoRA (more detail, better lighting)
8.2 ControlNet
- ControlNet
- 2023 Şubat'ta Lvmin Zhang tarafından yayınlanan, görsel üretimine 'yapı kontrolü' ekleyen mimari. Reference görselden çıkarılan canny edge / depth / pose / segmentation gibi yapısal bilgilerle yeni görsel üretimini yönlendirir. SD'nin 'prompt + chaos' yaklaşımının ötesinde precision control sağlar.
ControlNet modelleri:
- Canny: Edge detection — yapısal kopya
- Depth: Derinlik haritası — 3D kompozisyon
- OpenPose: İnsan iskeleti — pose kontrolü
- Lineart: Çizgi sanatından renkli
- Scribble: Karalama'dan görsel
- Segmentation: Semantic bölgeler
- MLSD: Düz çizgi (mimari)
- Normal: Yüzey normalleri
- Tile: Upscale + detay
Kurulum (A1111):
- Extensions sekmesi → URL: github.com/Mikubill/sd-webui-controlnet
- ControlNet model dosyalarını
extensions/sd-webui-controlnet/models/koy (Hugging Face: lllyasviel/sd-controlnet-canny vb.) - txt2img sekmesinde ControlNet panel açılır
8.3 IP-Adapter
Stil/karakter referans görseliyle yeni görsel üretimi:
- Reference görsel yükle
- IP-Adapter weight ayarla (0.5-1.0)
- Prompt yaz → reference stil + yeni içerik
CivitAI ve Hugging Face'te IP-Adapter modelleri.
9. Inpainting ve Outpainting
9.1 Inpainting — Bölgesel Düzenleme
Mevcut görselde bir alanı seç, sadece o alanı yeniden üret:
- img2img sekmesi → Inpaint tab
- Görsel yükle
- Brush ile düzeltmek istediğin alanı boya (maske)
- Yeni prompt yaz: "a different hat"
- Denoising strength 0.7-0.9 (yüksek = tam yeni)
- Generate
9.2 Outpainting — Genişletme
Görsel sınırlarını dışa doğru genişletme:
- Scripts → Outpainting mk2 (A1111)
- Direction: Up/Down/Left/Right
- Pixels to expand: 256 / 512
- Generate → yeni alan eklenir
10. Hires Fix ve Upscale
10.1 Hires Fix (A1111)
SD 1.5 ile 1024×1024 doğrudan üretmek bozuk sonuç verir. Hires Fix yolu:
- İlk pass 512×512 üret
- 2x upscale (Latent / R-ESRGAN / SwinIR)
- İkinci pass denoising 0.5-0.7 ile rafine
10.2 Upscale Models
- R-ESRGAN 4x+ Anime6B: Anime için
- R-ESRGAN 4x+: Genel photoreal
- 4x-UltraSharp: Üstün kalite
- SwinIR 4x: Yumuşak upscale
- NMKD Siax: Detay artırma
10.3 ESRGAN+ Standalone
upscayl uygulaması veya chaiNNer node-based upscaling işi.
11. Fine-Tuning — Kendi Modelini Eğitmek
11.1 LoRA Eğitimi (Kohya_ss)
LoRA Eğitimi (Kohya_ss)
- 1
Kohya_ss kur
github.com/bmaltais/kohya_ss → setup.bat (Windows) veya setup.sh (Linux)
- 2
Dataset hazırla
20-30 görsel (1024×1024 SDXL için). Aynı klasörde her görselin txt dosyası (caption). Trigger word seç (örn 'ZYXSTYLE').
- 3
Config
GUI'de: dataset path, output, training steps (1500-3000), batch size (1-4, GPU'ya göre)
- 4
Network rank
LoRA rank 32-64 (karakter), 128-256 (stil)
- 5
Eğit
Start training. RTX 4090 ~30-60 dakika SDXL LoRA için
- 6
Test
Output safetensors → A1111/ComfyUI models/Lora/. Prompt: 'ZYXSTYLE a cat'
11.2 DreamBooth (Full Fine-Tune)
LoRA yerine tüm modeli fine-tune — daha güçlü ama VRAM yoğun:
- Minimum 24GB VRAM (RTX 3090/4090)
- 4-8 saat training
- Sonuç: ~6GB checkpoint dosyası
11.3 Textual Inversion (Embeddings)
LoRA'dan önceki yaklaşım — küçük embedding (10-100KB) ile karakter/stil:
- Daha hızlı eğitim (15-30 dk)
- Daha sınırlı (sadece tek konsept)
- A1111 Train sekmesinde
12. Performans Optimization — Hızlandırma Teknikleri
12.1 xFormers
Memory-efficient attention. A1111 flag: --xformers. ComfyUI: pip install xformers.
Etkisi: %20-30 hız + %30-50 VRAM tasarrufu.
12.2 PyTorch 2.0+ scaled dot-product attention
--opt-sdp-attention flag. xFormers'tan biraz yavaş ama daha kararlı.
12.3 torch.compile
PyTorch 2.0+ ile model compile. ComfyUI'da custom node mevcut. İlk çalıştırma yavaş (warmup), sonraki çağrılar 30-50% hızlı.
12.4 TensorRT
NVIDIA TensorRT ile inference 2-3x hızlanır ama setup karmaşık. Production'da değerli.
12.5 LCM LoRA
Latent Consistency Model LoRA = 4-8 step ile 25-step kalitesi. SDXL için resmi LCM LoRA mevcut.
12.6 Hyper-SD
ByteDance'in 1-step inference LoRA'sı — saniyenin altında SDXL üretimi.
13. Troubleshooting — Yaygın Sorunlar
13.1 CUDA Out of Memory
Belirti: "CUDA out of memory"
Çözüm sırası:
- Resolution düşür (1024 → 768)
- Batch size 1
- xFormers aktif (
--xformers) --medvramveya--lowvram- Browser'da diğer GPU-yoğun tab'ları kapat
- NVIDIA driver güncel mi?
- CUDA cache clear: F5 yenile
13.2 Black Image (Siyah Görsel)
Belirti: Üretim biter, görsel tamamen siyah
Sebep: NaN error (genelde FP16 sayısal taşma)
Çözüm:
--no-halfflag (FP32, yavaş ama doğru)--upcast-sampling- VAE'yi farklı bir VAE ile değiştir
- Driver güncelle
13.3 Çift Kafa / Bozuk İnsan
Belirti: Bir görselde 2 kafa, 6 parmak, bozuk anatomi
Sebep: Yanlış çözünürlük + zayıf model
Çözüm:
- SD 1.5'te 512×512 native kal (1024 üretirsen bozuk)
- Hires Fix kullan
- Daha iyi model (Realistic Vision, Juggernaut XL)
- Negative prompt: "deformed, extra fingers, mutated"
- ADetailer eklentisi (otomatik yüz/el düzeltme)
13.4 Renkler Soluk / Doymuş
Çözüm:
- VAE doğru mu? (SDXL için sdxl_vae)
- CFG düşür (8 → 6)
- VAE'yi external ile değiştir
13.5 Modeli Yüklemiyor
Belirti: "Failed to load checkpoint"
Çözüm:
- Dosya bozuk mu? (hash kontrol)
models/Stable-diffusion/klasöründe mi?- A1111 Settings → Reload UI
13.6 İnternet Bağlantısı Sorunları
İlk kurulumda HuggingFace'den otomatik indirme. Türkiye'den hızlandırma:
- VPN (Cloudflare WARP — ücretsiz, hızlı)
- Mirror sites (HF mirror — Çin mirror'lar bazen Türkiye'de hızlı)
13.7 Eklenti Çakışması
Belirti: Yeni eklenti sonrası A1111 başlamıyor
Çözüm:
--disable-extra-extensionsflag ile başlatextensions/klasörden sorunlu eklentiyi sil- A1111 update et
13.8 Türkçe Prompt İşe Yaramıyor
SD modelleri (FLUX hariç) İngilizce eğitildi. Türkçe prompt sınırlı çalışır. Çözüm: ChatGPT/Claude ile İngilizce'ye çevir + detay ekle.
14. CivitAI Ekosistemi — Topluluk Modelleri
- CivitAI
- 2022'de kurulan, Stable Diffusion topluluk modelleri için dünyada en büyük platform. 200K+ checkpoint, 50K+ LoRA, embeddings, ControlNet, VAE. Kullanıcılar model yükler, başka kullanıcılar indirir + rate eder. CivitAI Generator web tabanlı üretim de sunar (ücretsiz/tier'lı).
14.1 CivitAI Kullanımı
- civitai.com hesap aç
- Browse Models → filter (SDXL, photoreal, anime, vb.)
- Sort: Most downloaded / Highest rated
- Model detay sayfasından safetensors indir → A1111/ComfyUI models klasörüne
14.2 CivitAI Best Practices
- Modelin LATEST versiyonunu kontrol et (eski versiyonu bazen daha iyi)
- Model'in "Trigger Words" listesini oku — bazı modeller için zorunlu
- Recommended Settings (sampler, CFG, steps) önerilerini uygula
- Other Users' images karşılaştır
14.3 KVKK ve CivitAI
CivitAI'de bazı modeller NSFW veya ünlü kişi LoRA. Bu modelleri kurumsal sunucuda kullanmak hukuki risk:
- Kurumsal sunucuda: sadece SFW + non-celebrity modeller indir
- Filtre: Family-friendly toggle
- Self-host kurumsal sunucuda: dahili moderasyon politikası
15. KVKK ve Kurumsal Self-Host
15.1 Kurumsal Self-Host Senaryosu
10 kişilik marketing ekibi:
- 1× RTX 4090 workstation (~₺75K)
- 1× Ubuntu Linux server
- ComfyUI server mode (--listen flag)
- Tüm ekip browser'dan internal IP'ye bağlanır
- Aylık: ~₺500 elektrik
- Karşılaştırma: 10× Midjourney Pro = $600/ay × 12 ay = $7200/yıl ≈ ₺240K/yıl
- ROI: 3-5 ay
15.2 Air-Gapped Kurulum
Banka/savunma için tam izole:
- Network adaptör kapalı server
- Modeller offline indirilip USB ile transfer
- ComfyUI tamamen lokal
- Workstation'da hot wallet erişimi yok
16. Performans Tuning ve Production
16.1 Server Setup (Multi-User)
A1111/ComfyUI'yı server gibi çalıştırma:
--listenflag (0.0.0.0)--apiflag (REST API endpoint)- nginx reverse proxy ile SSL + auth
- Aynı GPU'da queue management
16.2 Batch Üretim Otomasyon
A1111 API ile Python script:
batch_generate.py: requests library ile localhost:7860/sdapi/v1/txt2img endpoint'ine 100 prompt POST eder.
16.3 GPU Cluster
Birden çok GPU ile paralel batch:
- ComfyUI Multi-GPU custom nodes
- vLLM benzeri serving (SD için Diffusers-based)
17. 25+ Pratik İpucu
| İpucu | Detay |
|---|---|
| 1 | DPM++ 2M Karras 25 step default — çoğu durumda yeterli |
| 2 | SDXL için sdxl_vae.safetensors ZORUNLU |
| 3 | ADetailer eklentisi yüz/el düzeltir — life-saver |
| 4 | Regional Prompter eklentisi: farklı alanlara farklı prompt |
| 5 | xFormers + opt-sdp-attention birlikte aktif olmaz, biri seç |
| 6 | Civitai resmi 'helper' eklentisi A1111'e model otomatik etiketleme |
| 7 | LoRA strength 0.6-0.8 sweet spot — 1.0 abartı |
| 8 | Birden çok LoRA: weighted blend toplam 1.5'i aşmasın |
| 9 | Negative prompt için BadDream / EasyNegative embedding kullan |
| 10 | Hires Fix denoising 0.5-0.7 (yüksek = tam yeniden) |
| 11 | Refiner (SDXL): 0.7-0.85 noise switch — son %20 detay |
| 12 | Img2img denoising 0.3-0.5 (hafif değişim), 0.6-0.8 (büyük değişim) |
| 13 | Prompt'ta önceki kelime daha ağırlık taşır — önemli detay öne |
| 14 | (kelime:1.3) syntax ile ağırlık vermek mümkün |
| 15 | [kelime:adım] syntax ile belirli step'e kadar etkin tut |
| 16 | BREAK keyword ile prompt'ı bölmek — uzun prompt için CLIP 75 token reset |
| 17 | ControlNet weight 0.5-1.0 — düşük = yumuşak rehber |
| 18 | Aspect ratio bucket'lara uy (SDXL 1216×832 OK ama 1300×800 bozuk) |
| 19 | Seed'i kaydet — beğenilen görseli reproduce için |
| 20 | Generation Info'yu kaydet — sonraki üretim için template |
| 21 | TIs/embeddings hala yararlı — 'easynegative' negative prompt için |
| 22 | ComfyUI'da workflow JSON paylaşımı — başkasının workflow'ını drag-drop |
| 23 | FreeU eklentisi: detay artışı ekstra step gerekmeden |
| 24 | Hyper-SD LoRA: 1-2 step inference |
| 25 | LCM LoRA: 4-8 step inference |
| 26 | Custom Sampler Schedule (Karras, exponential, polyexponential) deneyin |
| 27 | Output klasörünü düzenli yedek al — kaybetmek istemezsin |
18. Sık Sorulanlar
Soru: SD 1.5 mi SDXL mi başlamalıyım?
Soru: A1111 mi ComfyUI mı?
Yeni başlayan: A1111 (kolay UI). Profesyonel + FLUX: ComfyUI. İdeal: ikisini de öğrenin, projeye göre seçin.
Soru: Türkçe destek var mı?
A1111/ComfyUI UI sadece İngilizce. Prompt için Türkçe sınırlı çalışır (T5-XXL kullanan FLUX hariç). ChatGPT ile İngilizce'ye çevirin.
Soru: Hangi sampler en iyi?
DPM++ 2M Karras — %90 senaryoda doğru cevap. Hız için Euler a, yüksek kalite için DPM++ 3M SDE.
Soru: VRAM yeterli mi?
- 6GB: SD 1.5 OK, SDXL zor
- 8GB: SD 1.5 hızlı, SDXL --medvram
- 12GB: SDXL native, FLUX Q4
- 16GB: SDXL + LoRA bol, FLUX Q8
- 24GB: Hepsi rahat, batch üretim
Soru: Mac'te ne kadar yavaş?
M1 Max ≈ RTX 2070 (yavaş). M3 Max ≈ RTX 3070 (orta). M3 Ultra ≈ RTX 4070 (iyi). Sessiz + taşınabilir ama hız RTX 4090'a kıyasla 3-5x yavaş.
Soru: SD ile ticari kullanım yasal mı?
SD 1.5/SDXL CreativeML OpenRAIL-M lisansı — ticari OK. SD 3.5 Stability AI Community License (gelir $1M altı serbest). FLUX Schnell Apache 2.0 — tam ticari. FLUX Dev non-commercial.
Soru: NSFW kullanabilir miyim?
Topluluk modelleri (CivitAI'de) NSFW destekli. Kurumsal sunucuda hukuki/etik risk — kişisel kullanım dışında dikkat. Türk Borçlar Kanunu + Reklam etik kurallarına uy.
Soru: ControlNet zorunlu mu?
Hayır ama profesyonel için önerilir. Yapısal kontrol (pose, perspektif, kompozisyon) için vazgeçilmez.
Soru: LoRA'ları nasıl eğitirim?
Kohya_ss GUI ile en kolay. 20-30 görsel + 30-60 dk RTX 4090 eğitim. AI Toolkit (Ostris) FLUX için.
Soru: Hangi eklenti ilk yüklemeli?
A1111 için: ControlNet, ADetailer, Civitai Helper, Regional Prompter, sd-webui-rembg.
Soru: SD'yi REST API ile kullanabilir miyim?
A1111: --api flag, localhost:7860/docs (Swagger). ComfyUI: WebSocket API + workflow JSON POST.
Soru: TensorRT ne kadar değer?
NVIDIA TensorRT 2-3x inference hızlandırma. Production'da değerli, geliştirme için karmaşık.
Soru: Cloud GPU mi yerel mi?
İlk denemeler için Colab/Replicate. Düzenli kullanım için yerel donanım. Yoğun (1000+ görsel/ay) için RTX 4090 yatırımı 6 ayda amortize.
Soru: SD'nin geleceği nedir?
SD 1.5 olgunluk, SDXL standart, SD 3.5 yeni nesil, FLUX rakip. Stability AI 2024'te zorlu dönem geçirdi ama 2025'te toparlandı. 2026-2027'de SD 4 (rumored) bekleniyor.
19. Sonuç — Önerilen Yol Haritası
3 ana çıkarım:
- Stable Diffusion yerel kurulum, AI görsel üretiminde maliyet + KVKK + esneklik için altın standart. Türk şirketleri için stratejik yatırım.
- Donanım yatırımı 6-12 ayda Midjourney/DALL-E maliyetinden tasarruf eder. RTX 3060 12GB (giriş, ₺9K) → RTX 4090 24GB (lider, ₺60K).
- UI seçimi profile bağlı: A1111 (yeni başlayan), ComfyUI (profesyonel), Fooocus (basit).
İlk 30 dakika önerilen adımlar:
- Donanımını kontrol et (NVIDIA GPU + VRAM)
- Python 3.10.6 + Git kur
- A1111 clone ve ilk model (SD 1.5) indir
- webui-user.bat çalıştır
- İlk prompt: "a cat sitting in a Turkish garden, photographic"
- Sampler DPM++ 2M Karras, 25 step, CFG 7
- İlk görseli üret, parametre dene
İlk hafta için:
- SDXL'e geç + Juggernaut XL veya DreamShaper XL indir
- 50+ prompt + parametre denemesi
- ControlNet kur + canny ile yapı kontrolü dene
- 5+ LoRA indir + dene
- CivitAI ekosistemini keşfet
İlk ay için:
- ComfyUI kur (workflow JSON paylaşılabilir)
- ADetailer + Regional Prompter eklenti
- LoRA fine-tune (kendi karakter/stil)
- API entegrasyonu (Python script ile batch)
- Photoshop pipeline (SD + retouch)
İlk 6 ay için (kurumsal):
- Server-mode SD (multi-user)
- KVKK risk değerlendirme + DPA
- LoRA library kurumsal (brand-specific)
- Maliyet izleme + Midjourney karşılaştırma
- Personel eğitimi (3-5 saatlik workshop)
Kaynaklar
- Stable Diffusion — Stability AI, Stability AI ·
- Automatic1111 WebUI — AUTOMATIC1111, GitHub ·
- ComfyUI — ComfyAnonymous, GitHub ·
- Forge UI — lllyasviel, GitHub ·
- Fooocus — lllyasviel, GitHub ·
- InvokeAI — InvokeAI, GitHub ·
- CivitAI — CivitAI, CivitAI ·
- Hugging Face Diffusers — Hugging Face, Hugging Face ·
- ControlNet Paper — Zhang, Rao, Agrawala, arXiv ·
- LoRA Paper — Hu et al., arXiv ·
- Kohya_ss GUI — bmaltais, GitHub ·
- AI Toolkit — Ostris, GitHub ·
- Stability AI Latent Diffusion Paper — Rombach et al., arXiv ·
Danismanlik Baglantilari
Bu yazıya en yakın consulting sayfaları
Bu içerikten sonraki mantıklı adım için en ilgili solution, role ve industry landing'lerini burada görebilirsin.
Kurumsal RAG Sistemleri Gelistirme
Sirket ici bilgiye kaynakli, guvenli ve denetlenebilir erisim saglayan uretim seviyesinde RAG mimarileri.
AI Agent ve Workflow Otomasyonu
Tek adimli chatbot'larin otesine gecen; arac, kural ve insan onayi ile ilerleyen AI destekli is akislarina gecis.
CTO'lar icin Kurumsal AI Mimari Danismanligi
PoC seviyesinde kalan AI girisimlerini guvenli, olceklenebilir ve production-ready mimarilere tasimak icin teknik liderlik danismanligi.