FLUX.1 Nedir? 2026 Black Forest Labs Görsel Modeli Türkçe Derin Teknik Rehber
Black Forest Labs'ın FLUX.1 görsel üretim modeli için derin teknik rehber: kurucu ekip hikayesi (eski Stability AI Robin Rombach ekibi), Rectified Flow Transformer mimarisi (DiT + flow matching), 4 variant detayı (Schnell Apache 2.0, Dev non-commercial, Pro API, 1.1 Pro Ultra), eğitim verisi ve metodolojisi, benchmark (insan yüzü, el detay, metin), ComfyUI + Diffusers + Forge kurulum adım adım, ControlNet + LoRA + IP-Adapter Flux için, prompt engineering detayları, T5 vs CLIP text encoder farkı, GGUF quantization (8-bit, 4-bit, NF4), Mistral Le Chat entegrasyonu, 20+ Türk kullanımı use-case, troubleshooting (OOM, NaN, slow), KVKK self-host.
Tek cümlelik cevap: FLUX.1 Black Forest Labs'ın foto-gerçekçi şampiyonu — Rectified Flow Transformer mimarisi, 12B parametre, T5-XXL encoder, 4 variant ile Apache 2.0'dan API'ye geniş yelpaze, RTX 3060'tan H100'e tüm donanım.
- FLUX.1, Black Forest Labs (BFL) tarafından 2024 Ağustos'ta yayınlanan, foto-gerçekçi + insan detay + metin entegrasyonunda sektör lideri AI görsel üretim modelidir. BFL kurucu ekibi: Robin Rombach + Andreas Blattmann + Dominik Lorenz — Stable Diffusion'ı Stability AI'da yaratmış orijinal ekip, 2024 Mart'ta ayrılıp BFL kurdu.
- Mimari: Rectified Flow Transformer (DiT mimarisi + flow matching eğitim). 12B parametre. Geleneksel UNet diffusion yerine Transformer + Flow Matching: daha az adımda (4-50) daha yüksek kalite, daha iyi prompt-takip, daha doğru insan anatomi.
- 4 ana variant: (1) FLUX.1 [schnell] — Apache 2.0, 4 adım, ücretsiz ticari, edge için, (2) FLUX.1 [dev] — Non-commercial, 28-50 adım, research, (3) FLUX.1 [pro] — API only, en yüksek kalite, ticari, (4) FLUX 1.1 [pro] / [pro] Ultra — 4MP çözünürlük, raw mode.
- Performans (HumanEval-style görsel bench): insan yüzü 9.5/10 (SD 3.5: 7), el-parmak detay 9/10 (SDXL: 5), metin in image 9/10 (SD 3.5: 6), foto-gerçekçi 9.5/10 (Midjourney: 9, DALL-E: 8.5). Sektör lideri foto-gerçekçi + detay.
- T5-XXL text encoder kullanır (CLIP yerine) — uzun karmaşık prompt'ları (256+ token) DAHA İYİ anlar. SD'nin 77 token limit'i Flux'ta 512+ token. Türkçe gibi non-İngilizce dillerde de daha akıcı.
- GGUF quantization (8-bit Q8_0, 4-bit Q4_K_M, NF4) ile 12GB VRAM'de bile çalışır. RTX 3060 12GB → Q4 ile 30-60 sn/görsel. RTX 4090 24GB → full FP16 8-15 sn/görsel.
- Türk kullanıcı için: Mistral Le Chat ($14.99/ay) Flux Pro entegre — TR akıcı + KVKK Frankfurt EU. Self-host Schnell + ComfyUI = KVKK %100 uyum + ücretsiz.
1. Giriş: Black Forest Labs ve FLUX'un Yükselişi
Yapay zeka görsel üretim alanı 2024 yazında dramatik bir değişim yaşadı. Stable Diffusion'ı Stability AI'da yaratan orijinal ekip şirketten ayrıldı ve Black Forest Labs (BFL) adıyla yeni şirket kurdu. BFL'in ilk ürünü olan FLUX.1, piyasaya çıktığı ilk haftada Midjourney ve DALL-E 3 ile karşılaştırıldı — ve foto-gerçekçi + insan anatomisi + metin entegrasyonu alanlarında sektör lideri konumuna geldi.
1.1 Kurucu Ekip — Stable Diffusion'ın Babaları
Black Forest Labs'ı anlamak için kurucu ekibe bakmak şart:
| Kişi | Rolü (BFL) | Geçmiş |
|---|---|---|
| Robin Rombach | CEO + Co-founder | Stable Diffusion 1.x, 2.x, SDXL co-author. Heidelberg Uni doktora. Latent Diffusion Models 2022 paper baş yazarı. |
| Andreas Blattmann | CSO + Co-founder | SDXL, SVD (Stable Video Diffusion) co-author. Diffusion model uzmanı. |
| Dominik Lorenz | Co-founder | Stable Diffusion mimarisi. Heidelberg Uni. |
| Patrick Esser | Co-founder | VQ-GAN co-author. CompVis Lab (Stability AI Almanya bölümü) baş AR-GE. |
Bu ekip 2022'de Latent Diffusion Models paper'ı ile diffusion model devrimini başlattı, 2024 Mart'ta Stability AI'dan ayrıldı (şirketin mali ve yönetim krizleri sebebiyle). Black Forest Labs Mart 2024'te kuruldu, Ağustos 2024'te FLUX.1'i yayınladı.
1.2 BFL'in Stratejik Konumu
BFL üç ayırt edici stratejiyle pazara girdi:
- Açık ağırlık + premium API hibrit: Schnell Apache 2.0 (Stability AI'nın benimsediği felsefe), Pro kapalı API (sürdürülebilir gelir)
- Avrupa AI hareketinin parçası: Almanya merkezli, GDPR uyumlu, Mistral AI ile stratejik ortaklık (Le Chat entegrasyonu)
- Foto-gerçekçi + detay önceliği: Midjourney'in artistik vurgusu yerine, Stability AI'nın SD 3'te tökezlediği yerlerde (insan anatomisi, eller, metin) üstün performans
2. FLUX.1 Mimarisi — Rectified Flow Transformer Derin Anatomi
- Rectified Flow Transformer
- FLUX.1'in temel mimari paradigması. İki ana inovasyonu birleştirir: (1) Diffusion Transformer (DiT) — geleneksel UNet diffusion mimarisinin yerine pure Transformer kullanımı; (2) Rectified Flow / Flow Matching — geleneksel diffusion'ın binlerce denoising adımı yerine 4-50 adımda doğrudan veri dağılımına 'akış'. Sonuç: daha az adımda yüksek kalite, daha iyi prompt-takip, daha doğru anatomi.
2.1 Geleneksel Diffusion vs Rectified Flow
| Özellik | Klasik Diffusion (SD 1.5/SDXL) | Rectified Flow (FLUX.1) |
|---|---|---|
| Backbone | UNet (CNN tabanlı) | Pure Transformer (DiT) |
| Sampling adım sayısı | 20-50 adım | 4-50 adım (Schnell: 4) |
| Noise trajectory | Eğri SDE (stochastic) | DÜZ ODE (deterministic) |
| Eğitim hedefi | Noise prediction (ε) | Velocity field prediction |
| Prompt adherence | Orta | Yüksek |
| İnsan anatomisi | Zayıf (SDXL 5/10) | Çok iyi (FLUX 9/10) |
| Long prompt anlama | 77 token limit (CLIP) | 512+ token (T5-XXL) |
| Eğitim maliyeti | Düşük-orta | Yüksek (12B param) |
| Inference hızı | Hızlı (basit) | Orta-hızlı (büyük model) |
2.2 Flow Matching Matematiksel Sezgisi
Geleneksel diffusion noise → image yolculuğunu eğri bir yörünge ile yapar (her adımda küçük bir denoise). Rectified Flow ise bu yolculuğu DÜZ hale getirir — sanki noise'tan image'a doğru direkt bir çizgi çekersin.
Matematiksel olarak:
- Diffusion: dx/dt = f(x, t) + g(t)·dW (stochastic, gürültülü)
- Rectified Flow: dx/dt = v(x, t) (deterministic, düz yol)
Pratik sonuç: 4 adımda Schnell, 28-50 adımda Dev/Pro yüksek kalite üretir. SDXL'in 30 adımı vs Flux Schnell'in 4 adımı = 7x daha hızlı edge deployment.
2.3 DiT (Diffusion Transformer) Detayları
| Bileşen | Detay |
|---|---|
| Toplam parametre | 12B |
| Transformer blok sayısı | 19 single-stream + 38 double-stream = 57 blok |
| Hidden dimension | 3072 |
| Attention head | 24 head × 128 boyut |
| Joint attention | Text + Image token'lar BİRLİKTE attention'da (multimodal joint attention) |
| Position encoding | RoPE (Rotary Position Embedding) — uzaysal koordinatlar için |
| Text encoder | CLIP-L (text-image alignment) + T5-XXL (5B param, dil anlama) |
| VAE | FLUX-VAE (16-channel latent, SD'den daha zengin) |
| Latent boyut | 1024×1024 image → 64×64×16 latent |
2.4 T5-XXL Text Encoder — En Kritik Inovasyon
Pratik fark — şu prompt'u düşünün:
"A red apple on the left, a green banana on the right, and a blue cup between them, with the words 'Healthy Snack' written below in cursive font"
- SD 1.5/SDXL (CLIP): Renk karışacak, konum atayacak, yazıyı tamamen yanlış yazacak
- FLUX.1 (T5-XXL): Doğru renk + doğru konum + okunabilir "Healthy Snack" yazısı
T5-XXL FLUX'un Türkçe prompt'larda da Stable Diffusion'dan belirgin üstün olmasının sebebi.
3. FLUX.1 Variant'ları — 4 + 1 Detayı
3.1 FLUX.1 [schnell] — Apache 2.0 Hızlı
- FLUX.1 [schnell]
- BFL'in ücretsiz, tamamen açık ağırlıklı, ticari kullanıma açık variant'ı. Apache 2.0 lisans. 4 adımda görsel üretir (timestep-distilled). 1-4 step inference için optimize. Edge deployment, hızlı prototyping, high-volume üretim için ideal. Hugging Face'te indirilebilir.
Schnell'in özellikleri:
- Lisans: Apache 2.0 — ticari kullanım tamamen serbest
- Boyut: 23.8 GB (FP16), 12B parametre
- Inference adımı: 1-4 step (default 4)
- Hız: RTX 4090'da 1024×1024 görsel ~5 saniye
- Kalite: Pro'dan biraz altta, SDXL'dan ÇOK üstte
- GGUF quantization mevcut: Q8_0 (~12GB VRAM), Q4_K_M (~6GB VRAM), NF4 (~6GB VRAM)
Kullanım senaryoları:
- Edge cihazlarda lokal üretim (RTX 3060+)
- High-volume otomasyon (sosyal medya, e-ticaret)
- Hackathon/MVP
- Topluluk fine-tune'lar (CivitAI'de 1000+ Schnell-based LoRA)
3.2 FLUX.1 [dev] — Non-Commercial Research
Dev'in özellikleri:
- Lisans: FLUX.1 [dev] Non-Commercial License
- Boyut: 23.8 GB (FP16)
- Inference adımı: 28-50 step (default 28)
- Hız: RTX 4090'da 28 step ~10-15 saniye
- Kalite: Pro'ya çok yakın (~%90)
- Kullanım: Research, kişisel, eğitim — TİCARİ KULLANIM YASAK
Önemli: Dev variant'ı self-host edip ticari kullanmak lisans ihlali. Ticari için Schnell (Apache 2.0) veya Pro API kullanmalısın.
3.3 FLUX.1 [pro] — Premium API
Pro'nun özellikleri:
- Erişim: Sadece BFL API veya Replicate/Together AI/Fal.ai üzerinden
- Lisans: Ticari kullanım dahil
- Adım: Default 28, gizli optimize edilmiş
- Kalite: En yüksek
- Fiyat: $0.05/görsel (BFL direct API)
3.4 FLUX 1.1 [pro] — Önemli Güncelleme (Ekim 2024)
FLUX 1.1 [pro] aynı API endpoint'te ama:
- 6x daha hızlı FLUX [pro]'ya göre
- Daha iyi prompt adherence
- Daha iyi diversity (aynı prompt → daha farklı varyantlar)
- Aynı fiyat ($0.05/görsel)
3.5 FLUX 1.1 [pro] Ultra & Raw — Lider Tier (Kasım 2024)
FLUX 1.1 [pro] Ultra:
- Çözünürlük: 4 megapiksel (2048×2048)
- Fiyat: $0.06/görsel
- Hız: ~10 sn
FLUX 1.1 [pro] Raw:
- Foto-gerçekçi style önyargısını AZALTIR
- DSLR-tarz, doğal, less stylized
- Özellikle insan portresinde mükemmel
| Variant | Lisans | Çözünürlük | Adım | Fiyat | Self-host |
|---|---|---|---|---|---|
| FLUX.1 [schnell] | Apache 2.0 | 1024×1024 | 1-4 | Ücretsiz | EVET |
| FLUX.1 [dev] | Non-commercial | 1024×1024 | 28-50 | Ücretsiz (research) | EVET (research) |
| FLUX.1 [pro] | API ticari | 1024×1024 | Gizli | $0.05/görsel | HAYIR |
| FLUX 1.1 [pro] | API ticari | 1024×1024 | Gizli | $0.05/görsel | HAYIR |
| FLUX 1.1 [pro] Ultra | API ticari | 2048×2048 | Gizli | $0.06/görsel | HAYIR |
| FLUX 1.1 [pro] Raw | API ticari | 1024×1024 | Gizli | $0.06/görsel | HAYIR |
4. Performans Benchmark Detayları
4.1 BFL Resmi Benchmark (2024)
BFL'in açıkladığı ELO benchmark — insan değerlendirme tabanlı:
| Model | ELO Skor | Prompt Following | Anatomy | Aesthetic |
|---|---|---|---|---|
| FLUX 1.1 [pro] Ultra | 1135 | 9.5 | 9.5 | 9 |
| FLUX 1.1 [pro] | 1099 | 9.3 | 9.4 | 8.8 |
| FLUX.1 [pro] | 1058 | 9 | 9.2 | 8.5 |
| Midjourney V6.1 | 1051 | 7.5 | 7 | 9.5 |
| DALL-E 3 | 1027 | 9 | 8 | 8 |
| FLUX.1 [dev] | 1013 | 8.5 | 8.8 | 8.2 |
| Stable Diffusion 3 Large | 970 | 8 | 6.5 | 7.5 |
| SDXL | 910 | 6.5 | 5 | 7 |
| FLUX.1 [schnell] | 895 | 8 | 8 | 7.8 |
Çıkarım:
- FLUX 1.1 [pro] Midjourney V6.1'i geçen ilk açık model (Schnell self-host varyantı dahil)
- Midjourney aesthetic'te hala lider (9.5) ama anatomy ve prompt-following'te FLUX baskın
- FLUX [schnell] bile SDXL'den belirgin üstün
4.2 Spesifik Yetenek Benchmarks
| Görev | FLUX 1.1 [pro] | DALL-E 3 | Midjourney V6 | SD 3.5 |
|---|---|---|---|---|
| İnsan yüzü gerçekçilik | 9.5 | 8.5 | 9 | 7 |
| El + parmak sayısı doğruluğu | 9 | 8 | 8 | 5 |
| Metin (yazı in image) | 9 | 9.5 | 6 | 6 |
| Spatial relationship (sol/sağ) | 9 | 8.5 | 7 | 7 |
| Sayma (3 elma vs 5 elma) | 8 | 7.5 | 6 | 6 |
| Renk eşleme | 9 | 9 | 8 | 8 |
| Logo / brand assets | 8 | 9 | 6 | 6 |
| Mimari foto-gerçekçi | 9.5 | 8.5 | 9 | 8 |
| Ürün fotoğrafı (e-ticaret) | 9.5 | 8.5 | 8 | 7.5 |
| Anime / illustration | 7 | 7 | 9 (Niji) | 8 (LoRA) |
5. ComfyUI ile FLUX Kurulum — Adım Adım
5.1 Gereksinimler
| Donanım | Variant Önerisi | Inference Hızı |
|---|---|---|
| GTX 1060 6GB | NF4 Schnell only | ~3-5 dakika |
| RTX 3060 12GB | Q4_K_M / NF4 | ~30-60 saniye |
| RTX 4070 12GB | Q4 + LoRA | ~20-40 saniye |
| RTX 4080 16GB | Q8_0 + LoRA | ~15-25 saniye |
| RTX 4090 24GB | Full FP16 | ~5-15 saniye |
| Mac M1 Max 32GB | Q4 (MLX) | ~60-90 saniye |
| Mac M3 Max 64GB | Q8_0 (MLX) | ~30-50 saniye |
| 1×A100 80GB | Full FP16 + batch 4 | ~3 saniye/görsel |
| 1×H100 80GB | Full FP16 | ~2 saniye/görsel |
5.2 Kurulum Adımları
ComfyUI + FLUX.1 [dev] Kurulum (Windows / Linux)
- 1
ComfyUI indir
github.com/comfyanonymous/ComfyUI → Releases → ComfyUI_windows_portable.7z (Windows) veya git clone repo (Linux).
- 2
Python ortam
Windows portable hazır. Linux için: python -m venv venv && source venv/bin/activate && pip install -r requirements.txt
- 3
ComfyUI Manager kur
git clone https://github.com/ltdrdata/ComfyUI-Manager into ComfyUI/custom_nodes/. Eklenti yönetimi için zorunlu.
- 4
FLUX [dev] model indir
huggingface.co/black-forest-labs/FLUX.1-dev → flux1-dev.safetensors (~23.8GB) → ComfyUI/models/unet/. Lisans onay gerekir.
- 5
VAE indir
huggingface.co/black-forest-labs/FLUX.1-schnell/blob/main/ae.safetensors → ComfyUI/models/vae/
- 6
T5-XXL encoder indir
huggingface.co/comfyanonymous/flux_text_encoders → t5xxl_fp16.safetensors (9.8GB) veya t5xxl_fp8_e4m3fn.safetensors (4.9GB, daha hızlı) → ComfyUI/models/clip/
- 7
CLIP-L indir
huggingface.co/comfyanonymous/flux_text_encoders → clip_l.safetensors (246MB) → ComfyUI/models/clip/
- 8
ComfyUI çalıştır
Windows: run_nvidia_gpu.bat. Linux: python main.py. Browser açılır: localhost:8188
- 9
FLUX workflow yükle
comfyanonymous.github.io/ComfyUI_examples/flux/ → FLUX Dev örnek workflow JSON drag-drop ComfyUI'a. Otomatik node grafiği oluşur.
- 10
İlk görsel
Prompt yaz, Queue Prompt. 28 step ~15 saniye RTX 4090'da.
5.3 GGUF Quantization ile Düşük VRAM Kurulumu
12GB VRAM'lik bir kullanıcı için GGUF Q4_K_M quantize edilmiş FLUX:
FLUX GGUF Q4 Kurulum (12GB VRAM için)
- 1
GGUF model indir
huggingface.co/city96/FLUX.1-dev-gguf → flux1-dev-Q4_K_M.gguf (~7GB) → ComfyUI/models/unet/
- 2
GGUF custom node
ComfyUI Manager → Install → 'ComfyUI-GGUF' ara, yükle. Restart.
- 3
T5 Q4 indir
Aynı repo → t5xxl_Q4_K_M.gguf (~2.5GB) → models/clip/
- 4
Workflow değişiklik
ComfyUI workflow'ta 'Load Diffusion Model' node yerine 'Unet Loader (GGUF)' kullan. Aynı şekilde CLIP node için 'DualCLIPLoader (GGUF)'.
- 5
Test
Aynı prompt'la üret. RTX 3060 12GB'da ~30-45 saniye, RTX 4070 12GB'da ~20-30 saniye. Kalite Q8_0'a göre %5-10 düşer, FP16'ya göre %10-15.
5.4 NF4 Quantization (En Düşük VRAM)
NF4 (NormalFloat 4-bit) daha agresif quantize, 6GB VRAM'de bile çalışır:
- Boyut: ~6GB FLUX model
- Hız: RTX 3060 8GB'de ~60-90 saniye
- Kalite: Q4'ten biraz altta ama hala FLUX kalitesi
Indirme: huggingface.co/lllyasviel/flux1-dev-bnb-nf4
6. Prompt Engineering FLUX İçin
6.1 FLUX Prompt Yaklaşımı — SD'den Farklı
6.2 FLUX Prompt Yapısı Şablonu
Etkili FLUX prompt formülü:
[ÖZNE detayı] + [AKSİYON/POZ] + [SAHNE detay] + [STIL/TARZ] + [TEKNİK detay]
Örnek doğru FLUX prompt:
"A 35-year-old Turkish chef with dark wavy hair and warm brown eyes, wearing a white double-breasted chef coat and a navy blue apron, carefully arranging meze plates on a wooden counter, in the warmly lit kitchen of a modern Istanbul restaurant with copper pots hanging from the ceiling and a window showing the Bosphorus at sunset, captured in the style of a National Geographic editorial photograph, shot on a Sony A7R IV with an 85mm f/1.4 lens, shallow depth of field, golden hour rim lighting, professional color grading"
6.3 SD vs FLUX Prompt Karşılaştırması
| Model | Optimal Prompt |
|---|---|
| SD 1.5 / SDXL | best quality, masterpiece, 8k, 1woman, blonde hair, blue eyes, white shirt, modern office, smiling, professional photo --no deformed, extra fingers |
| FLUX.1 | A confident woman with blonde hair and blue eyes wearing a white blouse, smiling warmly while working in a modern office space, professional corporate photography, soft natural window light, captured on a Canon R5 with 50mm lens |
6.4 Negative Prompt FLUX'ta YOK
FLUX rectified flow mimarisi gereği negative prompt kullanmaz (CFG = 1.0). SD'de "no deformed, no extra fingers, no blurry" yazmak alışkanlığı FLUX'ta gereksiz. Bunun yerine:
- Pozitif prompt'ta NE İSTEDİĞİNİ açıkla
- "high quality, sharp focus, photorealistic" gibi pozitif modifier'lar kullan
6.5 FLUX'a Özel Parametreler (Diffusers / API)
| Parametre | Anlam | Değer Aralığı | Tavsiye |
|---|---|---|---|
| num_inference_steps | Sampling adım sayısı | Schnell: 1-4, Dev/Pro: 20-50 | Schnell 4, Dev 28 |
| guidance_scale | Prompt adherence | Dev: 3.5-5.0, Schnell: 0 (yok) | 3.5 |
| width / height | Çözünürlük | 256-2048 | 1024×1024 default |
| seed | Tekrarlanabilirlik | Integer | Test için sabit, prod için random |
| max_sequence_length | T5 token limit | 256 / 512 | 512 (uzun prompt için) |
7. ControlNet, LoRA, IP-Adapter — FLUX İleri Özellikleri
7.1 FLUX ControlNet
FLUX için ControlNet 2024 sonu ekosistemde olgunlaştı:
| ControlNet Tip | Sağlayıcı | Kullanım |
|---|---|---|
| Canny | XLabs-AI | Edge detection — yapısal kontrol |
| Depth | XLabs-AI / Shakker | Derinlik haritası — 3D kompozisyon |
| OpenPose | XLabs-AI | İnsan pozu kopyalama |
| HED | XLabs-AI | Yumuşak kenar |
| Tile | Jasperai | Upscale + detay enhancement |
| Inpainting | AlimamaCreative | Görsel parça düzenleme |
| IP-Adapter | XLabs-AI | Referans görsel stil aktarımı |
| Redux | BFL official | Görsel + prompt birleşik prompting |
ComfyUI workflow'da ControlNet kullanımı:
- "Load ControlNet Model (Flux)" node ekle
- Reference image yükle → preprocessor (Canny, Depth, vb.)
- ControlNet Apply node → conditioning'e ekle
7.2 FLUX LoRA Fine-Tuning
FLUX için LoRA eğitimi 2025'te erişilebilir hale geldi:
Donanım gereksinimi:
- RTX 4090 24GB: 5-15 dakika training (20 görsel dataset)
- RTX 3090 24GB: 10-25 dakika
- 1×A100 80GB: 3-8 dakika
Tool seçimi:
- AI Toolkit (Ostris): En kolay (config dosyası ile)
- Kohya_ss: Olgun, esnek
- Replicate FLUX Fine-Tuning: Cloud, kod yazma yok
Eğitim adımları:
AI Toolkit ile FLUX LoRA Eğitimi
- 1
Dataset hazırla
20-30 görsel + her birinin txt dosyası (caption). Örnek: marka logosu LoRA için 20 marka görseli + 'a logo of TRENDX brand showing a red wave' caption.
- 2
AI Toolkit kur
git clone https://github.com/ostris/ai-toolkit && cd ai-toolkit && python -m venv venv && source venv/bin/activate && pip install -r requirements.txt
- 3
Config yaz
config/examples/train_lora_flux_24gb.yaml dosyasını dataset path'iyle güncelle. Trigger word seç (örn 'TRENDX_LOGO').
- 4
Eğit
python run.py config/train_lora_flux_24gb.yaml. 1500 step ~15 dakika RTX 4090'da.
- 5
Kullan
output/trendx_logo/trendx_logo.safetensors → ComfyUI/models/loras/. Prompt: 'a TRENDX_LOGO on a black T-shirt' + Load LoRA node.
7.3 IP-Adapter — Stil Aktarımı
IP-Adapter referans görselin stilini aktarır:
- Reference görsel → IP-Adapter → conditioning
- Sonuç: Yeni prompt + eski stil
Örnek: Bir Wes Anderson filmi screenshot'ı + "modern coffee shop interior" prompt → Wes Anderson tarzında kafe.
8. Mistral Le Chat Entegrasyonu — Türk Kullanıcı için Pratik
Le Chat'ta FLUX kullanımı:
- chat.mistral.ai → Image generation aktif
- Prompt yaz (Türkçe akıcı kabul edilir)
- FLUX [pro] çalışır, görsel üretir
- Aylık fair-use sınır içinde sınırsız
9. Türk Kullanıcı için 20 Detaylı Use-Case
9.1 E-Ticaret Ürün Görseli
Use-Case 1: Premium Türk Seramik Tabak
Prompt: "A handcrafted premium Turkish ceramic plate with traditional Iznik tile patterns in cobalt blue, turquoise, and coral red on white background, top-down view, professional product photography, soft studio lighting with subtle shadow, photorealistic, captured on Hasselblad medium format, 8k commercial quality"
Variant: FLUX 1.1 [pro] Ultra (4MP — yüksek çözünürlük e-ticaret için) Maliyet: $0.06/görsel
9.2 Marketing Reklam
Use-Case 2: Türk Restoran Sosyal Medya
Prompt: "A vibrant Turkish meze platter with hummus, baba ganoush, dolma, and grilled halloumi cheese, beautifully arranged on a rustic wooden board with fresh herbs, warm Mediterranean lighting, top-down editorial food photography, captured with Canon R5 85mm macro lens, shallow depth of field, professional color grading"
9.3 İnsan Portresi — KVKK Uyarısı
Use-Case 3: Stok Tarzı Türk Profesyonel
Prompt: "A confident 32-year-old Turkish businessman with neatly trimmed dark beard wearing a charcoal grey suit and a crisp white shirt, smiling warmly at the camera, modern Istanbul office backdrop with floor-to-ceiling windows showing the Bosphorus, professional corporate photography style, soft natural light from the side, captured on Sony A7R IV with 85mm f/1.4 lens, shallow depth of field"
Önemli KVKK uyarı: Gerçek kişiyi referans almıyorsan OK. Mevcut çalışan/müşteri yüzünü prompt'a koymak KVKK ihlali.
9.4 Mimari Visualizasyon
Use-Case 4: Modern Türk Villa
Prompt: "Exterior of a modern minimalist Turkish villa with white plaster walls, dark wooden accents, and a flat green roof, infinity pool in the foreground reflecting the dramatic sunset sky, surrounded by olive trees and cypress, located on a hillside overlooking the Aegean Sea near Bodrum, architectural rendering, photorealistic, captured at golden hour with a 24mm wide angle lens"
9.5 Mobil Oyun Karakteri
Use-Case 5: Anatolian Mythology Karakter
Prompt: "A heroic warrior character inspired by Anatolian mythology, wearing ornate leather armor with silver kilim-pattern engravings, wielding a curved kilic sword that glows with mystical blue energy, dramatic three-quarter pose, intricate fantasy character design, hand-painted illustration style reminiscent of Riot Games concept art, dark moody atmosphere with rim lighting"
9.6 Çocuk Kitabı İllüstrasyonu
Use-Case 6: Friendly Çoban Köpeği
Prompt: "A friendly and cute Anatolian shepherd dog (Kangal) puppy with soft fluffy fur and big expressive brown eyes, sitting in a sunny field of yellow tulips with mountains in the background, gentle children's book illustration style, watercolor and ink, soft warm pastel color palette, by Beatrix Potter and Mary Blair"
9.7 Geleneksel Sanat
Use-Case 7: Ottoman Miniature Tarzı
Prompt: "A detailed Ottoman miniature painting in the style of Levni, depicting a Topkapi Palace garden scene with cypress trees, tulips, and a flowing fountain, intricate hand-painted details, gold leaf accents, traditional flat perspective without western depth, on aged parchment background"
9.8 Yemek Fotoğrafı
Use-Case 8: Kunefe Detay
Prompt: "A perfectly golden Turkish kunefe pastry filled with melted cheese and topped with pistachios and a drizzle of warm syrup, served on an ornate vintage brass plate, close-up macro food photography, dramatic side lighting highlighting the crispy shredded phyllo texture, captured on Sony A7R IV with 90mm macro lens, shallow depth of field, dark moody background"
9.9 Logo & Brand
Use-Case 9: Türk Kahve Markası Logosu
Prompt: "A minimalist modern logo for a premium Turkish coffee brand named 'EFENDI', featuring a stylized cup with steam forming the silhouette of a tulip, deep burgundy and gold color scheme, clean vector design with the text 'EFENDI' below in elegant serif typography, professional brand identity, on white background"
9.10 Sinematik Konsept Art
Use-Case 10: Cyberpunk İstanbul 2080
Prompt: "Cyberpunk Istanbul in 2080, the iconic Galata Tower now adorned with massive holographic advertisements in Turkish and English, rain-slicked streets reflecting the neon lights below, flying vehicles in the misty sky, blade runner aesthetic, cinematic wide shot, color graded in teal and orange, atmospheric, 35mm anamorphic lens"
9.11 Profesyonel Headshot
Use-Case 11: LinkedIn Profil Fotoğrafı
Prompt: "Professional LinkedIn-style headshot of a confident Turkish woman in her late 30s with shoulder-length dark hair, wearing a tailored navy blue blazer over a white silk blouse, slight smile, looking directly at the camera, clean light grey background, soft three-point studio lighting with subtle rim light, sharp focus on eyes, captured on a Phase One medium format camera, retouched for professional use"
9.12 Real Estate Listing
Use-Case 12: Modern Daire İç Mekan
Prompt: "Interior of a modern luxury 2-bedroom apartment in Istanbul, open concept living room with floor-to-ceiling windows showing a panoramic view of the Bosphorus and the Bosphorus Bridge in the distance, contemporary Scandinavian-Turkish fusion design with light oak wood floors, white walls, a beige sectional sofa, and a kilim rug, warm afternoon light, real estate photography, ultra-wide 16mm lens, perfectly straight vertical lines"
9.13 Otomotiv Marketing
Use-Case 13: Türk Klasik Otomobil
Prompt: "A pristine 1970s Anadol A2 (classic Turkish car) in deep maroon color, parked on a cobblestone street in Beyoglu, Istanbul, with warm afternoon sunlight casting long shadows, vintage automotive photography style, slight film grain, captured on Kodachrome film aesthetic, 50mm lens, sharp details on chrome bumper and badges"
9.14 Eğitim Materyali
Use-Case 14: Anatomi İnfografik
Prompt: "Educational anatomical diagram of the human heart with clearly labeled chambers, valves, and major blood vessels in Turkish (Sol Atriyum, Sağ Atriyum, Aort, etc.), professional medical illustration style with cross-section view, scientific accuracy, clean white background, color-coded systems"
Not: FLUX metin entegrasyonunda Türkçe için bazen hatalı yazabilir; vector grafik yazılımıyla post-edit önerilir.
9.15 Sosyal Medya Banner
Use-Case 15: Instagram Hikaye
Prompt: "Vertical 9:16 social media story design announcing Black Friday sale, featuring a stylized shopping bag overflowing with gifts, bold dynamic composition, vibrant turquoise and gold color palette, Turkish text 'BÜYÜK İNDİRİM' prominently displayed in bold modern sans-serif typography, energetic and exciting feel, ready for Instagram Stories"
9.16 Sanat Eseri
Use-Case 16: Modern Sanat Eseri
Prompt: "A modern abstract painting inspired by traditional Turkish kilim weaving patterns, featuring bold geometric shapes in deep red, ochre, indigo blue, and ivory, textured impasto brushwork, mixed media on canvas, contemporary gallery aesthetic, by Mark Rothko meets Anatolian textile art"
9.17 Haber/Gazetecilik
Use-Case 17: Symbolic Editorial
Prompt: "A symbolic editorial illustration for a news article about renewable energy transition in Turkey, showing wind turbines and solar panels integrated harmoniously with the iconic Anatolian landscape including stone houses and olive groves, hopeful and inspiring mood, modern editorial illustration style, clean lines and limited color palette"
9.18 Etkinlik Posteri
Use-Case 18: Müzik Festivali Posteri
Prompt: "A vibrant music festival poster for 'Anadolu Vibes Festival', featuring traditional Turkish musical instruments (saz, ney, darbuka) abstracted into modern geometric forms, neon color gradient from purple to magenta to orange, festival date and lineup text in modern Turkish typography, energetic dynamic composition, vertical poster format A2"
9.19 E-Sport Karakter
Use-Case 19: Türk E-Sport Takım Maskotu
Prompt: "A fierce e-sport team mascot character named 'KURT' (wolf in Turkish), stylized anthropomorphic grey wolf in dynamic action pose, wearing futuristic gaming gear with subtle Turkish flag colors, energetic glowing red eyes, modern e-sport branding aesthetic, by Riot Games and Blizzard character art teams, professional vector illustration"
9.20 İllüstrasyon Stiller
Use-Case 20: Aynı Konseptin 5 Farklı Stilde Üretimi
Aynı konsept (Türk kahvesi içen kedi):
- Watercolor: "watercolor illustration, soft wash, light texture"
- Photoreal: "professional product photography, studio lighting"
- Oil painting: "oil painting, thick brushstrokes, Renaissance style"
- Anime: "anime illustration, expressive eyes, Studio Ghibli style"
- Pixar 3D: "3d render, pixar animation style, cinema 4d"
10. Troubleshooting — Yaygın Sorunlar
10.1 CUDA Out of Memory (OOM)
Belirti: "torch.cuda.OutOfMemoryError: CUDA out of memory"
Çözümler (sırasıyla):
- Daha küçük çözünürlük: 1024×1024 → 768×768
- T5-XXL FP16 → FP8 (4.9GB)
- GGUF Q8_0 → Q4_K_M
- Tile-based VAE decoding (ComfyUI'de "Tiled VAE Decode" node)
- CPU offload (ComfyUI launch flag: --cpu-vae)
- NF4 quantization (en agresif)
- Daha düşük batch size (1)
10.2 NaN Output (Siyah Görsel)
Belirti: Üretim tamamlanır ama görsel tamamen siyah
Sebep: Sayısal taşma (genelde VAE veya text encoder'da)
Çözüm:
- FP32 VAE kullan (--force-fp32-vae)
- Daha iyi VAE (FLUX-VAE.safetensors official)
- T5 encoder'ı FP16'ya zorla
10.3 Yavaş Inference
Belirti: RTX 4090'da 30+ saniye/görsel
Çözüm:
- xFormers kurulu mu? (pip install xformers)
- PyTorch 2.0+ ile torch.compile aktif et
- VAE batch decode
- T5 encoder cache (aynı prompt → reuse)
- TeaCache veya FBCache custom node
10.4 Prompt'a Uymuyor
Belirti: Model prompt'un bir bölümünü görmezden geliyor
Çözüm:
- T5-XXL FP16 kullan (FP8 prompt anlama %5 düşürür)
- guidance_scale 3.5 → 5.0 (daha sıkı prompt-following)
- Prompt'u doğal cümleler şeklinde yaz (tag değil)
- max_sequence_length 512 (kesilmesin)
10.5 İnsan El/Parmak Hala Bozuk
Belirti: FLUX bile bazen 6-parmak veya bükük el üretebilir
Çözüm:
- FLUX 1.1 [pro] kullan (daha iyi anatomi)
- Reseed (farklı seed)
- ControlNet OpenPose ile el pozu kontrolü
- Inpainting ile sadece el alanını yeniden üret
11. KVKK ve Kurumsal Kullanım
Türk Kurumsal Karar Matrisi
| Kurum Tipi | Önerilen FLUX Variant | Sebep |
|---|---|---|
| Türk Banka | FLUX Schnell self-host (ComfyUI) | KVKK + air-gapped + Apache 2.0 ticari serbest |
| E-Ticaret KOBİ | FLUX 1.1 [pro] API veya Mistral Le Chat | Yüksek kalite + AB region uyum |
| Marketing Ajansı | Mistral Le Chat Pro + FLUX | €14.99/ay sınırsız + KVKK |
| Yerel Gazete / Medya | FLUX Schnell self-host | Ücretsiz + KVKK + sansürsüz editorial |
| Eğitim Kurumu | Schnell self-host (üniversite GPU) | Eğitim + ücretsiz + araştırma serbest |
| Savunma Sanayi | Schnell air-gapped on-prem | Veri dışarı çıkmaz, lisans serbest |
| İçerik Üretici / Freelance | Together AI / Replicate FLUX API | Pay-as-you-go, $0.003-0.05/görsel |
12. FLUX vs Stable Diffusion 3.5 — Detaylı Karşılaştırma
| Özellik | FLUX.1 [dev] | Stable Diffusion 3.5 Large |
|---|---|---|
| Parametre | 12B | 8B |
| Mimari | DiT + Rectified Flow | MMDiT + Flow Matching |
| Text encoder | CLIP-L + T5-XXL | CLIP-L + CLIP-G + T5-XXL |
| ELO Skor (BFL bench) | 1013 | 970 |
| İnsan anatomi | 9/10 | 6.5/10 |
| Metin entegrasyon | 9/10 | 6/10 |
| Hız (RTX 4090, 28 step) | ~12 sn | ~10 sn |
| Lisans (büyük) | Non-commercial (dev) / Apache (schnell) / API (pro) | Stability AI Community License |
| LoRA fine-tune | Olgun (2025) | Olgun |
| ControlNet | XLabs + topluluk | Olgun (1.5'ten devraldı) |
| CivitAI model sayısı | ~5K (2026) | ~15K (Hâlâ daha geniş) |
13. FLUX Ekosistemi — Tool ve Servisler
| Servis | Tip | Fiyat | Özellik |
|---|---|---|---|
| BFL API | Resmi API | $0.025-0.06/görsel | Tüm variant Pro |
| Replicate | API wrapper | $0.003-0.05/görsel | Schnell ucuz |
| Together AI | API wrapper | $0.0025-0.03 | Volume için optimal |
| Fal.ai | API wrapper | $0.003-0.05 | Hızlı + cached |
| Mistral Le Chat | UI consumer | €14.99/ay | KVKK Frankfurt |
| Krea.ai | UI + brushes | $10-35/ay | Live drawing FLUX |
| Leonardo.ai | UI + assets | $10-60/ay | Game assets focused |
| Freepik AI | Stock + AI | $5-15/ay | Stock + FLUX combo |
| Civitai | Model hub | Ücretsiz | FLUX LoRA topluluk |
| AI Toolkit (Ostris) | LoRA train | Ücretsiz OSS | Kolay LoRA training |
| ComfyUI | UI workflow | Ücretsiz OSS | Profesyonel node-based |
| Forge UI | UI | Ücretsiz OSS | SD + FLUX hibrit |
| Diffusers (Hugging Face) | Python lib | Ücretsiz OSS | Programmatic |
14. Maliyet Modeli — 1000 Görsel/Ay Senaryolari
| Yöntem | Maliyet | Hız | Kalite |
|---|---|---|---|
| BFL API FLUX 1.1 [pro] | $50 | Hızlı | 10/10 |
| BFL API Ultra (4MP) | $60 | Orta | 10/10 |
| Replicate Schnell | $3 | Hızlı | 8/10 |
| Together AI Schnell | $2.5 | Hızlı | 8/10 |
| Mistral Le Chat Pro | €15 (sınırsız fair use) | Orta | 9/10 |
| Self-host Schnell (RTX 4090) | ~$15 elektrik | Çok hızlı | 8/10 |
| Self-host Dev (RTX 4090, research) | ~$15 elektrik | Orta | 9.5/10 |
| Karşılaştırma: Midjourney Pro | $60 (sınırsız + Stealth) | Orta | 9/10 (aesthetic 10/10) |
| Karşılaştırma: ChatGPT Plus + DALL-E 3 | $20 (sınırsız fair use) | Çok hızlı | 8/10 |
15. FLUX Gelecek Roadmap (2026-2027 Tahminleri)
BFL'in açıklamalarına ve sektör söylentilerine göre:
- FLUX.2 (beklenen 2026 Q3): Daha yüksek çözünürlük native (4096×4096), daha hızlı inference, multimodal input (görsel + ses)
- FLUX Video: AI video üretim modeli (Sora 2 / Runway rakibi)
- FLUX Edit: Inpainting/outpainting odaklı dedicated model
- FLUX Pro Sub-second: Tek saniye altı production-grade görsel
16. Sık Sorulanlar
Soru: FLUX Schnell'i ticari kullanabilir miyim?
Soru: FLUX Türkçe prompt anlar mı?
T5-XXL çok dilli eğitildi, Türkçe akıcılığı SD'den belirgin daha iyi. Yine de en kaliteli sonuç için Türkçe prompt'u ChatGPT/Claude ile İngilizce'ye optimize edip detay eklemek önerilir.
Soru: 8GB VRAM'li GPU'da FLUX çalışır mı?
Evet, NF4 quantization (~6GB) ile. Hız yavaş (60-120 sn/görsel) ama çalışır. RTX 2060/3060 8GB'lik kullanıcılar için seçenek.
Soru: FLUX vs Midjourney — hangisini seçeyim?
- Aesthetic / sanatsal yoğun: Midjourney
- Foto-gerçekçi / ürün / mimari: FLUX
- Ücretsiz self-host: FLUX Schnell (Midjourney'in yok)
- Çok dilli prompt: FLUX (T5-XXL avantajı)
Soru: FLUX 1.1 [pro] Ultra ne kadar daha iyi?
Ultra 4 megapiksel (2048×2048) çözünürlük + daha sharp + better small details (gözler, tekstür, yazı). Sosyal medya/web için Ultra abartı, basılı medya/print/large format için kritik fark.
Soru: FLUX LoRA eğitmek kaç görselle?
Minimum 10, optimal 20-30, üst sınır 100-200. Çok az → underfit, çok fazla → overfit (style'a iyice yapışmaz). 20 görsel sweet spot.
Soru: FLUX inpainting destekliyor mu?
Evet, AlimamaCreative tarafından FLUX inpainting controlnet 2025 başında yayınlandı. ComfyUI workflow ile entegre. Adobe Firefly seviyesinde inpainting mümkün.
Soru: FLUX vs DALL-E 3 metin entegrasyonu?
DALL-E 3 metin entegrasyonunda biraz daha öndedir (logo, poster yazıları). FLUX yakın ama hala bazen yazıyı hatalı yazar. Hibrit yaklaşım: FLUX ile temel görsel + Photoshop/Figma ile yazı ekle.
Soru: ABD kullanıcılara satarken FLUX [pro] lisansı sorun mu?
BFL API ToS ticari kullanıma izin verir. End-user kontrol görsel ürettiği görsel telifi senin. Ancak: dev variant'ı self-host edip API satıyorsan licensing ihlali — sadece Schnell veya Pro API yapabilirsin.
Soru: FLUX ne kadar GPU power tüketir (elektrik)?
RTX 4090 inference'ta ~320W. Bir saatte 200-300 görsel üretebilir. Elektrik maliyeti (Türkiye ~3 TL/kWh): saatte 1 TL. 1000 görsel ~3-5 TL elektrik. Çok ucuz.
Soru: FLUX modelini fine-tune etmek için ne gerekli?
Full fine-tune: 8×A100 80GB minimum (12B model). LoRA fine-tune: 1×RTX 4090 24GB yeterli. Tipik kullanım LoRA — full fine-tune sadece BFL kendisi yapar.
Soru: Türkçe metin (yazı) içeren görsel için FLUX güvenilir mi?
Karışık. Kısa Türkçe (1-3 kelime) genelde doğru. Uzun Türkçe yazılarda hata oranı yükselir (Türkçe karakterleri yanlış yazma yaygın). Profesyonel kullanımda görsel + post-process önerilir.
Soru: FLUX'u CPU'da çalıştırabilir miyim?
Teknik olarak evet, pratikte mantıksız. GGUF + Intel/AMD CPU + 64GB RAM ile çalışır ama 10-30 dakika/görsel. GPU gerek.
17. Sonuç — Önerilen Yol Haritası
3 ana çıkarım:
- FLUX.1, AI görsel üretiminin foto-gerçekçi ve detay liderliğidir. Mimari (Rectified Flow Transformer + T5-XXL) bunun teknik temelini sağlar.
- 4 variant ile her bütçe ve senaryoya cevap verir — Schnell (Apache 2.0 ücretsiz) → Dev (research) → Pro (premium API) → 1.1 Pro Ultra (4MP lider).
- Türk kullanıcı için iki ana yol: Mistral Le Chat ile AB-region cloud + KVKK uyum (€15/ay), veya self-host Schnell ile %100 KVKK + ücretsiz (RTX 4090 + ComfyUI yatırımı).
İlk 30 dakika önerilen adımlar:
- Mistral Le Chat hesabı aç (€14.99/ay, KVKK Frankfurt) — Türkçe prompt + FLUX [pro] erişim
- 10 farklı use-case (yukarıdaki örnekler) test et
- Replicate hesabı aç — Schnell API pay-as-you-go ($0.003) deneme
- Kalite tatmin ederse: kalıcı abonelik (Mistral) ya da self-host yatırım kararı
İlk hafta için:
- ComfyUI + Schnell self-host kur (eğer RTX 4090+ varsa)
- 20+ farklı stil prompt dene (foto-real, watercolor, oil paint, anime, 3D)
- LoRA fine-tune denemesi (AI Toolkit + 20 görsel + 15 dk eğitim)
- ControlNet'i test et (referans pose / depth)
İlk ay için:
- Kurumsal kullanım için: KVKK risk değerlendirmesi + DPA imzalama
- Workflow optimization: prompt template kütüphanesi
- Maliyet izleme + ROI hesaplama
- Photoshop/Figma ile pipeline (FLUX + post-process)
Kaynaklar
- Black Forest Labs Official — BFL, Black Forest Labs ·
- FLUX.1 Announcement — BFL, BFL ·
- FLUX Hugging Face — BFL, Hugging Face ·
- FLUX.1 Schnell Apache 2.0 — BFL, Hugging Face ·
- ComfyUI — ComfyAnonymous, GitHub ·
- ComfyUI FLUX Examples — ComfyAnonymous, ComfyUI ·
- FLUX GGUF Quantized — city96, Hugging Face ·
- Mistral Le Chat — Mistral AI, Mistral ·
- AI Toolkit — Ostris, GitHub ·
- XLabs-AI FLUX ControlNets — XLabs, GitHub ·
- Replicate FLUX — Replicate, Replicate ·
- Rectified Flow Paper — Liu et al., arXiv ·
- DiT Paper — Peebles, Xie, arXiv ·
- Civitai — Civitai, Civitai ·
Danismanlik Baglantilari
Bu yazıya en yakın consulting sayfaları
Bu içerikten sonraki mantıklı adım için en ilgili solution, role ve industry landing'lerini burada görebilirsin.
Kurumsal RAG Sistemleri Gelistirme
Sirket ici bilgiye kaynakli, guvenli ve denetlenebilir erisim saglayan uretim seviyesinde RAG mimarileri.
AI Agent ve Workflow Otomasyonu
Tek adimli chatbot'larin otesine gecen; arac, kural ve insan onayi ile ilerleyen AI destekli is akislarina gecis.
CTO'lar icin Kurumsal AI Mimari Danismanligi
PoC seviyesinde kalan AI girisimlerini guvenli, olceklenebilir ve production-ready mimarilere tasimak icin teknik liderlik danismanligi.