Yapay Zeka Etkileşimli Araçları
RAG Maliyet Hesaplayıcı
Vektör DB + LLM token + embedding + altyapı maliyetlerini aylık ve yıllık olarak hesaplar. Pinecone, Weaviate, Qdrant, pgvector kıyaslar.
Özet (TL;DR)
Tek cümlelik cevap: Vektör DB, LLM, embedding ve altyapı kalemleri ayrı ayrı hesaplanır.
- Pinecone, Weaviate, Qdrant, pgvector + 5 LLM + 4 embedding karşılaştırması.
- Aylık + yıllık projeksiyon ve 12 aylık trend grafiği.
- 5 maliyet düşürme önerisi senin durumuna göre üretilir.
Tanım
- RAG Maliyeti
- Retrieval-Augmented Generation sisteminin aylık toplam maliyeti; vektör DB, embedding üretimi, LLM token tüketimi ve operasyonel altyapı kalemlerinin toplamıdır.
- Ayrıca: RAG cost, retrieval cost, vector DB cost
Girdiler
Aylık Tahmin
Vektör DB
$20
LLM
$2100
Embedding modeli
$6
Altyapı
$90
Toplam
$2,216
/ ay · $26,592 / yıl
Optimize için 5 öneri
- LLM toplam maliyetin %60+'sını alıyor. Prompt caching aç, retrieval adımlarında daha küçük model kullan, max_tokens kıs.
- Deterministik sorguları 1 saat TTL ile cache'le.
- Re-ranker harcamasını denetle; küçük açık kaynak rerankerlar %40 düşürür.
- LLM sağlayıcısıyla yıllık commit pricing pazarlık et (~%10-25 indirim).
- Tenant başına token tavanı koy.
Pricing değerleri Q1 2026 public listelere dayanır; tahminîdir. Anlaşmaya göre değişir.
Kaynaklar
- Pinecone Pricing, Pinecone Systems
- OpenAI API Pricing, OpenAI
- Anthropic API Pricing, Anthropic
- Qdrant Cloud Pricing, Qdrant