Skip to content

TTS FT: XTTS-v2 + F5-TTS + Kokoro + Parler-TTS — Turkish Voice Cloning (Consent + KVKK)

Text-to-Speech FT — insufficient TR baselines. XTTS-v2 (Coqui), F5-TTS (zero-shot voice cloning), Kokoro (StyleTTS2-based), Parler-TTS (description-controlled). Personal voice clone with 5-10 min reference audio. 1-3h FT on RTX 4090. **Ethics: consent + KVKK + deepfake risk**.

Şükrü Yusuf KAYA
28 min read
Advanced
TTS FT: XTTS-v2 + F5-TTS + Kokoro + Parler-TTS — Türkçe Ses Klonlama (Rıza + KVKK)
⚠️ Etik & Hukuk Uyarısı
Ses klonlama deepfake yapma yeteneği verir. Cookbook'un TTS FT Lab'ları yalnız açık rıza ile çekilmiş kendi sesin veya profesyonel voice talent (rıza + lisans) için kullanılmalı. Başkasının sesini izinsiz klonlamak Türk Ceza Kanunu (TCK) m. 134/3 (kişisel veri suistimal) ve KVKK kapsamında suç. Cookbook'un kuralı: rıza yok → projeyi başlatma.

1. TTS Model Karşılaştırma (2026)#

ModelParamsTR supportZero-shot voice cloneLisans
XTTS-v2 (Coqui)750M✅ native6s referenceCoqui Public License
F5-TTS335M⚠️ FT gerek✅ excellentMIT
Kokoro82M❌ EN/JA onlysınırlıApache 2.0
Parler-TTS880M⚠️ FT gerekdescription-controlApache 2.0
StyleTTS2 (yerel FT)350MFT gerekiyiMIT
ElevenLabs (closed API)n/aiyiexcellentproprietary
Cookbook tavsiyesi (TR): XTTS-v2 — native TR var, voice clone iyi.
✅ Teslim
  1. Kendi sesinden 10 dakika kayıt al, rıza formu doldur. 2) XTTS-v2 ile 30 dakika FT. 3) Klonlanmış sesinle Türkçe metin okut. 4) Sonraki ders: 7.7 — Speaker ID + Diarization.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

Related Content

TTS Fine-Tuning: XTTS-v2 + F5-TTS Türkçe Ses Klonlama + Etik | Fine-Tuning Cookbook (Model-by-Model)