Capstone Module 19: Turkish Multimodal Document Processing System — Production SaaS
Module 19 capstone: Turkish multimodal document processing production SaaS. Next.js drag-drop frontend + FastAPI backend + selectable Llama-3.2-Vision or GPT-4o + KVKK-compliant encrypted storage + Stripe payment. ID OCR, e-invoice, exam paper, free tier + premium. Curriculum's 10th production artifact: docproc.sukruyusufkaya.com.
Şükrü Yusuf KAYA
90 min read
Advanced🎯 Capstone — 10. Production Artefakt
Modül 19'un 3 dersinde multimodal LLM'lerin tarihi (CLIP → GPT-4o), mimari matematiği (linear/Q-Former/cross-attention), Türkçe pratiği (kimlik OCR, e-fatura, vs.) işlendi. Şimdi gerçek bir production SaaS kuruyoruz: docproc.sukruyusufkaya.com.
Hedef: Türkçe doküman drag-drop yükleme + otomatik OCR + alan çıkarma + JSON/CSV export. Hem GPT-4o (premium) hem Llama-3.2-Vision (KVKK ücretsiz tier) seçimi.
Tech stack:
- Frontend: Next.js 14 + Tailwind + react-dropzone
- Backend: FastAPI + Pydantic + Celery (queue)
- Storage: S3-compatible + AES-256 encryption
- DB: PostgreSQL (metadata) + Redis (queue)
- Payment: Stripe (TL + USD)
- Auth: Clerk veya NextAuth
- Deploy: Vercel (FE) + Hetzner (BE) — KVKK için Türkiye yakın
Maliyet (aylık):
- Llama-3.2-90B-Vision self-host: $300 (Hetzner GPU)
- GPT-4o API kullanımı: kullanıma göre, ortalama $200-500
- Storage: $20
- Domain + SSL: $5
- Toplam: $525-825/ay
Müfredatın 10. production artefaktı:
1-9. (önceki modüllerden)
10. Türkçe Doküman İşleme SaaS ← şimdi
Bu artık 'eğitim projesi' değil — gerçek müşterilere değer sağlayan ürün. 90 dakikada full stack mimari + business model + KVKK uyumu öğreniyoruz.
Capstone Akışı (10 Aşama)#
- Sistem mimarisi — full stack diagram
- Frontend (Next.js) — drag-drop + result display
- Backend (FastAPI) — queue + worker pattern
- Multimodal LLM router — GPT-4o vs Llama-3.2-Vision seçimi
- Storage + Encryption — AES-256, KVKK uyumlu
- Stripe Payment — free tier + premium
- Deployment — Vercel + Hetzner (Türkiye yakın)
- Monitoring — Sentry + Grafana
- Maliyet analizi — break-even
- Launch checklist + pazarlama
text
# Türkçe Doküman İşleme SaaS — Tam Stack Mimari ┌──────────────────────────────────────────────────────────────┐│ KULLANICI (Tarayıcı) ││ docproc.sukruyusufkaya.com ││ - Drag-drop file upload ││ - Result table (kimlik alanları, fatura kalemleri) ││ - JSON / CSV export ││ - Free tier 5/ay, Premium ₺99/ay 500/ay │└────────────────────────────┬─────────────────────────────────┘ │ HTTPS ▼┌──────────────────────────────────────────────────────────────┐│ FRONTEND (Next.js 14 / Vercel — Edge) ││ - App Router + React Server Components ││ - Tailwind CSS + shadcn/ui ││ - react-dropzone, lucide-icons ││ - Auth: Clerk (Türkçe lokalize) ││ - KVKK consent banner │└────────────────────────────┬─────────────────────────────────┘ │ HTTPS, JWT auth ▼┌──────────────────────────────────────────────────────────────┐│ API GATEWAY (Vercel Edge Functions) ││ - Rate limiting (free: 5/ay, premium: 500/ay) ││ - File validation (max 10MB, only PNG/JPG/PDF) ││ - JWT verification (Clerk) ││ - Stripe webhook handler │└────────────────────────────┬─────────────────────────────────┘ │ HTTPS ▼┌──────────────────────────────────────────────────────────────┐│ BACKEND (FastAPI / Hetzner Frankfurt) ││ - Job queue (Redis + Celery worker) ││ - Document type classifier (kimlik/fatura/sınav/...) ││ - Multimodal LLM router (GPT-4o veya Llama-3.2-Vision) ││ - PostgreSQL: metadata + audit log ││ - Encrypted storage: S3-compatible + AES-256 │└────────────────────────────┬─────────────────────────────────┘ │ ┌────────────────────┼─────────────────────────┐ ▼ ▼ ▼┌──────────────────┐ ┌──────────────────┐ ┌──────────────────┐│ GPT-4o API │ │ Llama-3.2-90B │ │ Stripe API ││ (Premium tier) │ │ Self-host │ │ Payment ││ $5/1M tokens │ │ Hetzner GPU │ │ TL + USD │└──────────────────┘ └──────────────────┘ └──────────────────┘ │ ▼┌──────────────────────────────────────────────────────────────┐│ MONITORING & OBSERVABILITY ││ - Sentry: error tracking + performance ││ - Grafana Cloud: metrics + dashboards ││ - Slack: critical alerts ││ - Email: daily summary │└──────────────────────────────────────────────────────────────┘ Full Stack Mimari Diyagramı
🎉 Modül 19 Tamamlandı — Multimodal LLM'lerin Tam Anatomi
Modül 19 final (4 ders, 340 dakika):
- 19.1: Multimodal Tarihçesi — CLIP 2021'den GPT-4o 2024'e
- 19.2: Mimari Matematiği — Linear / Q-Former / Cross-Attention
- 19.3: Türkçe Multimodal Pratiği — 5 production use case
- 19.4 Capstone: Türkçe Doküman SaaS — 10. production artefakt
Müfredatın 10. production artefaktı üretildi: . Türkçe kimlik OCR, e-fatura, sınav kağıdı dijitalleştirme — gerçek müşteri değeri.
docproc.sukruyusufkaya.comÖnceki: 1 ders / 75 dk → Şimdi: 4 ders / 340 dk. 4.5× genişleme, uzman kalitesi.
Modül 19 Envanteri (Yeniden Yazıldı)#
| # | Ders | Süre |
|---|---|---|
| 19.1 | Multimodal Tarihçesi: CLIP → GPT-4o | 80 dk |
| 19.2 | Mimari Matematik: Linear/Q-Former/Cross-Attn | 85 dk |
| 19.3 | Türkçe Multimodal Pratiği | 85 dk |
| 19.4 | Capstone Türkçe Doküman SaaS | 90 dk |
| Toplam | 4 ders | 340 dk (~5.7 saat) |
Önceki: 1 ders / 75 dk → Şimdi: 4 ders / 340 dk.
Frequently Asked Questions
**Yes, real market exists**:
**Target customer segments**:
- SMB accounting firms (e-invoice processing) — 50K+ firms in Turkey
- Banking side-service providers (ID OCR API resale) — niche but high budget
- Education technology (exam paper digital) — DERSHANE market 5M+ students
- Real estate firms (reference check ID OCR) — mid-size
**Go-to-market**:
- LinkedIn outreach (TR accounting managers, IT directors)
- HiHello business networking
- Sell as SDK to Turkish AI startups
**Realistic pricing**:
- Free: 5 doc/month (acquisition)
- Pro: ₺99/month, 500 doc/month (SMB)
- Enterprise: ₺499/month, 5000 doc/month (mid-size firm)
- API tier: $0.05/doc (developer)
**1-year target**: 100 paying customers × ₺99 = ₺9,900/month = ₺120K/year recurring revenue. Decent side income.
Warning: customer acquisition is work. SaaS marketing learning curve is large.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
Related Content
Module 0: Course Framework & Workshop Setup
Who Is an LLM Engineer? The AI Engineering Career Ladder from Junior to Staff
Start LearningModule 0: Course Framework & Workshop Setup
Course Philosophy: Why This Path, Why This Order — The Skeleton of an 8-Month Curriculum
Start LearningModule 0: Course Framework & Workshop Setup