Veri Mühendisliği ve AI Altyapısı
Veri Mühendisliği ve AI Altyapısı alanındaki 109 terim — her biri Türkçe-İngilizce tanımlı, ilgili kavramlara bağlı.
En Çok Okunanlar
Tüm Terimler (109)
Agregasyon Tablosu
Detay verilerden türetilmiş özet sonuçları saklayarak analitik sorguları hızlandıran tablo yapısı.
Akış Gecikme Farkı
Üretilen olaylarla tüketilen olaylar arasındaki gecikme farkını ifade eden temel akış sağlığı metriği.
Akış Join'i
Birden fazla sürekli veri akışını zaman ve anahtar mantığıyla birleştirerek anlamlı olay bağlamı üretme işlemi.
Akış Pencereleme
Sürekli veri akışını belirli zaman veya olay aralıklarında gruplayarak hesaplama yapma yaklaşımı.
Akış İşleme
Sürekli gelen veri olaylarının düşük gecikme ile işlenmesine dayanan işlem yaklaşımı.
Ambar Partition Anahtarı
Veri ambarı tablolarında veriyi mantıksal parçalara ayırmak için kullanılan ana bölümleme alanı.
Açık Tablo Formatı
Büyük ölçekli veri gölü tablolarında sürümleme, transaction ve metadata yönetimini destekleyen açık standart tablo yapısı.
Backfill
Geçmiş dönem verilerinin sonradan yeniden işlenmesi veya eksik tarihsel veri boşluklarının doldurulması işlemi.
Batch Birikimi
Planlanan batch işlerinin zamanında tamamlanamaması nedeniyle işleme kuyruğunda biriken yük durumu.
Batch İş
Belirli bir zaman planına göre veya tetikleyiciyle çalışan toplu veri işleme görevi.
Bağımlılık Yönetimi
Bir veri akışındaki görevlerin, veri setlerinin ve işlem sıralarının birbirine bağlılığını kontrollü biçimde yönetme süreci.
Bağımlılık Çözümleme
Bir veri iş akışındaki görevlerin ve veri varlıklarının hangi sırada ve hangi koşullarda çalışacağını belirleme süreci.
Benzerlik Metriği
Vektörler arasındaki yakınlığın nasıl hesaplanacağını tanımlayan temel arama ölçütü.
Birleştirme Politikası
Yeni ve mevcut kayıtlar çakıştığında hangi kaydın hangi kurala göre korunacağını tanımlayan yükleme mantığı.
Boyutsal Modelleme
Analitik sorgular için veri yapılarını olgular ve boyutlar etrafında düzenleyen modelleme yaklaşımı.
DAG
Veri işleme görevlerini yönlü ve döngüsüz bağımlılık grafiği olarak modelleyen temel orkestrasyon yapısı.
Dashboard Lineage
Bir dashboard içindeki metrik ve görsellerin hangi veri setleri, sorgular ve dönüşümlerle beslendiğini gösteren iz yapısı.
Denetim İzi
Veri ve işlem değişikliklerinin kim tarafından, ne zaman ve nasıl yapıldığını kaydeden izleme mekanizması.
Değişim Yayılım Analizi
Bir veri varlığındaki veya iş mantığındaki değişikliğin platform boyunca nasıl yayılacağını analiz etme süreci.
Dosya Budama
Sorgu sırasında gereksiz dosyaların taranmasını önleyerek veri gölü performansını artıran optimizasyon tekniği.
Downstream Kırılma Riski
Bir veri varlığında yapılan değişikliğin bağlı rapor, model veya servislerde kırılma yaratma ihtimalini ifade eden risk ölçütü.
Durum Deposu
Akış işleme sırasında geçmiş bağlamı ve ara hesap durumlarını saklayan kalıcı veya yarı kalıcı veri yapısı.
Dönüşüm Denetim Zinciri
Veri dönüşümlerinin hangi sırayla, hangi mantıkla ve hangi sürüm altında yapıldığını denetlenebilir biçimde saklayan iz yapısı.
Dönüşüm Katmanı
Ham veriyi analitik veya operasyonel kullanım için yeniden şekillendiren kurallı işleme katmanı.
ELT
Verinin önce hedef platforma yüklendiği, dönüşümlerin ise depolama veya hesaplama katmanında sonradan yapıldığı modern yaklaşım.
ETL
Verinin kaynak sistemlerden çekilip dönüştürüldükten sonra hedef analitik ortama yüklendiği klasik veri entegrasyon yaklaşımı.
Embedding Versiyonlama
Farklı embedding modelleri veya güncellenmiş embedding üretim süreçlerinin sürümlerle yönetilmesi yaklaşımı.
Etki Analizi
Bir veri değişikliğinin hangi raporları, modelleri, tabloları veya süreçleri etkileyebileceğini önceden değerlendirme süreci.
Etkileşim Alanı Analizi
Bir veri değişikliğinin veya arızasının kaç varlığı ve hangi kritik süreçleri etkileyebileceğini ölçen risk analizi yaklaşımı.
Event Time
Bir olayın sisteme ne zaman ulaştığından bağımsız olarak gerçekte ne zaman meydana geldiğini ifade eden zaman kavramı.
Exactly-Once Semantics
Her veri olayının sistem tarafından mantıksal olarak yalnızca bir kez işlenmesini garanti etmeyi hedefleyen işleme modeli.
Feature Kullanımdan Kaldırma Politikası
Artık önerilmeyen veya desteklenmeyen feature tanımlarının kontrollü biçimde kullanım dışına alınmasını yöneten politika.
Feature Registry
Feature tanımlarının, sürümlerinin, sahipliğinin ve kullanım durumlarının merkezi olarak tutulduğu kayıt katmanı.
Feature Serving API
Canlı tahmin sırasında gerekli feature'ları standart bir arayüz üzerinden sağlayan servis katmanı.
Feature Store
Makine öğrenmesi özelliklerinin merkezi, tekrar kullanılabilir ve eğitim-servis tutarlılığıyla yönetildiği altyapı katmanı.
Feature Tutarlılık Kontrolü
Eğitim ve canlı servis tarafında kullanılan feature değerlerinin aynı tanım ve mantıkla üretildiğini doğrulayan kontrol süreci.
Feature Versiyonlama
Feature tanımlarının zaman içindeki değişimlerini izlenebilir sürümler halinde yönetme yaklaşımı.
HNSW Index
Yüksek boyutlu vektörlerde hızlı yaklaşık komşu arama için hiyerarşik grafik yapısı kullanan indeksleme yöntemi.
Ham Bölge
Kaynak verilerin minimum müdahale ile ilk kabul edildiği veri gölü katmanı.
Hibrit Arama
Semantik vektör aramayı anahtar kelime ve filtre tabanlı klasik arama teknikleriyle birleştiren yaklaşım.
İdempotensi
Aynı işlemin birden fazla kez çalıştırılmasına rağmen tutarlı ve tekrar etmeyen sonuç üretme özelliği.
İş Akışı Orkestrasyonu
Birden fazla veri işleme adımının bağımlılık, sıra ve zamanlama kurallarıyla merkezi biçimde yönetilmesi yaklaşımı.
İş Metadata'sı
Veri varlıklarının iş anlamını, kullanım amacını ve kurumsal tanımlarını açıklayan metadata katmanı.
İş Yükü İzolasyonu
Farklı sorgu ve hesaplama türlerinin birbirini boğmasını önlemek için kaynakların ayrıştırıldığı veri ambarı yaklaşımı.
İş Zamanlayıcı
Batch veya hibrit veri işlerinin ne zaman ve hangi koşullarda çalışacağını yöneten sistem bileşeni.
İş Zincirleme
Batch işlerinin çıktı-girdi ilişkisine göre ardışık biçimde birbirini tetiklediği yürütme modeli.
Kaynak Sistem Replikasyonu
Kaynak sistemdeki verinin analitik veya operasyonel amaçlarla başka bir ortama kopyalanması yaklaşımı.
Kesim Zamanı
Bir batch işinin belirli bir veri dönemi için hangi ana kadar gelen kayıtları kabul edeceğini belirleyen zaman sınırı.
Kolon Seviyesi Lineage
Tek tek veri alanlarının hangi kaynak kolonlardan türediğini ve nasıl dönüştürüldüğünü izleyen ayrıntılı lineage düzeyi.
Kullanım Metadata'sı
Bir veri varlığının kimler tarafından, ne sıklıkta ve hangi amaçlarla kullanıldığını gösteren metadata türü.
Kürasyon Bölgesi
Temizlenmiş, anlamlandırılmış ve analitik kullanıma daha uygun hale getirilmiş veri gölü katmanı.
Lakehouse
Veri gölünün esnekliğini veri ambarının yönetilebilirliği ve performans özellikleriyle birleştiren modern mimari yaklaşım.
Lineage Güven Skoru
Otomatik veya yarı otomatik çıkarılmış lineage bilgisinin güvenilirlik düzeyini ifade eden kalite göstergesi.
Lineage Mutabakatı
Farklı lineage kaynaklarından gelen iz bilgilerinin birbiriyle tutarlı hale getirilmesi süreci.
Lineage Tabanlı Erişim Etkisi
Bir veri varlığındaki erişim yetkisi değişikliğinin bağlı veri ürünleri ve tüketici sistemler üzerindeki etkisini analiz eden yaklaşım.
Lineage Tamlığı
Lineage bilgisinin veri akışındaki tüm kritik adımları ve bağımlılıkları kapsama düzeyini ifade eden kalite boyutu.
Lineage-Metadata Senkronizasyonu
Metadata tanımları ile lineage ilişkilerinin birbiriyle tutarlı ve güncel kalmasını sağlayan senkronizasyon yaklaşımı.
Medallion Mimarisi
Ham veriden güvenilir analitik veriye ilerleyen katmanlı veri işleme modeli.
Metadata
Veri hakkında veri niteliği taşıyan tanım, kaynak, kullanım ve teknik yapı bilgileri bütünü.
Metadata Kalite Skoru
Metadata'nın tamlık, güncellik, açıklık ve yönetişim düzeyini ölçmek için kullanılan kalite puanı.
Metadata Registry
Metadata nesnelerinin standart, yönetilebilir ve erişilebilir biçimde saklandığı merkezi kayıt yapısı.
Metadata Versiyonlama
Metadata tanımlarının zaman içindeki değişimlerini izlenebilir sürümler halinde saklama yaklaşımı.
Model Lineage
Bir makine öğrenmesi modelinin hangi veri, feature, kod sürümü ve eğitim akışıyla üretildiğini gösteren izleme yapısı.
Offline Feature Store
Model eğitimi, backtesting ve batch feature üretimi için kullanılan tarihsel ve hacimli feature depolama katmanı.
Olay Şema Kayıt Defteri
Akış tabanlı sistemlerde olay şemalarının merkezi olarak tutulduğu ve evriminin yönetildiği yapı.
Online Feature Store
Canlı tahmin anında düşük gecikmeyle özellik sunmak üzere optimize edilmiş feature store katmanı.
Operasyonel Metadata
Veri akışlarının çalışma durumu, yenilenme zamanı, hata geçmişi ve işleme performansı gibi operasyonel bilgileri içeren metadata katmanı.
PII Lineage Takibi
Kişisel verilerin veri platformu içinde nereden gelip nereye gittiğini izlemeye odaklanan özel lineage yaklaşımı.
Partition Budama
Toplu işleme ve sorgularda yalnızca ilgili partition'ları işleyerek maliyeti azaltan optimizasyon tekniği.
Partitioning
Büyük veri kümelerini mantıksal parçalara ayırarak okuma, yazma ve işleme verimliliğini artırma tekniği.
Pipeline Gözlemlenebilirliği
Veri boru hatlarının sağlık, gecikme, hacim ve hata davranışlarının sürekli izlenmesini sağlayan yaklaşım.
Pipeline SLA
Bir veri boru hattının beklenen teslim süresi, başarı oranı ve kullanılabilirlik seviyesini tanımlayan hizmet standardı.
Point-in-Time Join
Bir tahmin anında gerçekten erişilebilir olan geçmiş özellikleri kullanarak eğitim verisi üretme yaklaşımı.
Pushdown Transformation
Dönüşüm işlemlerinin ayrı bir katmanda değil, verinin bulunduğu motor veya platform üzerinde çalıştırılması yaklaşımı.
Sahipsiz Varlık Tespiti
Artık upstream veya downstream bağlantısı kalmamış veri varlıklarını belirlemeye yönelik lineage tabanlı kontrol süreci.
Schema-on-Read
Veri yazılırken değil, okunurken şema uygulanmasını esas alan esnek veri işleme yaklaşımı.
Semantik Katman
İş metriklerini, tanımları ve sorgu mantığını teknik veri yapılarının üzerinde tutarlı biçimde soyutlayan katman.
Semantik Lineage
Veri varlıklarının yalnızca teknik değil, iş anlamı düzeyinde nasıl türetildiğini ve bağlandığını gösteren lineage yaklaşımı.
Sorgu Hızlandırma
Veri ambarı sorgularının daha düşük gecikme ve daha yüksek verimle çalışmasını sağlayan optimizasyon yaklaşımı.
Soğuk Depolama Katmanı
Nadiren erişilen ancak saklanması gereken verilerin düşük maliyetli depolama katmanında tutulması yaklaşımı.
Staging Area
Kaynak verilerin nihai dönüşüm öncesinde geçici olarak tutulduğu ara veri hazırlık katmanı.
Sözlük Uyumu
İş terimleri sözlüğü ile teknik veri varlıklarının anlam bakımından tutarlı hale getirilmesi süreci.
Vektör Aramada Metadata Filtreleme
Vektör benzerliği sonuçlarını tarih, kaynak, kullanıcı veya kategori gibi ek alanlarla daraltma yaklaşımı.
Vektör Normalizasyonu
Embedding vektörlerinin büyüklük etkisini kontrol altına alarak daha tutarlı arama davranışı sağlama işlemi.
Vektör Veritabanı
Embedding tabanlı arama ve benzerlik sorguları için optimize edilmiş yüksek boyutlu veri depolama ve erişim sistemi.
Vektör Önbelleği
Sık sorgulanan embedding veya retrieval sonuçlarını daha hızlı erişim için geçici olarak saklayan performans katmanı.
Veri Ambarı
Raporlama, analitik ve karar destek için yapılandırılmış, bütünleşik ve sorgu odaklı veri depolama ortamı.
Veri Boru Hattı
Verinin bir kaynaktan alınıp işlenerek farklı hedef sistemlere güvenilir biçimde taşınmasını sağlayan işlem zinciri.
Veri Gölü
Yapılandırılmış ve yapılandırılmamış verilerin ham veya düşük işlenmiş halde ölçeklenebilir biçimde saklandığı depolama katmanı.
Veri Lineage
Bir veri öğesinin kaynaktan dönüşümlere ve son kullanım noktasına kadar izlenebilir yaşam yolculuğu.
Veri Provenance
Bir veri öğesinin kökenini, üretim koşullarını ve işlem geçmişini açıklayan kaynak güvenilirliği perspektifi.
Veri Seti Bağımlılık Haritası
Veri setleri arasındaki bağımlılık ilişkilerini sistematik biçimde gösteren haritalama yapısı.
Veri Sözleşmesi Zorlaması
Şema, kalite ve teslim beklentilerinin tanımlanmakla kalmayıp sistem tarafından aktif biçimde uygulanması yaklaşımı.
Veri Yaşam Döngüsü Katmanlama
Verinin erişim sıklığı, yaşı ve iş değeri değiştikçe farklı depolama katmanlarına geçirilmesi yaklaşımı.
Veri Ürünü Lineage
Bir veri ürününün hangi kaynaklardan beslendiğini, nasıl üretildiğini ve hangi tüketicilere hizmet verdiğini gösteren iz yapısı.
Yaklaşık En Yakın Komşu Arama
Yüksek boyutlu vektör uzaylarında tam doğruluk yerine yüksek hız ve kabul edilebilir yakınlık sağlayan arama yaklaşımı.
Yavaş Değişen Boyut
Boyut tablolarındaki zaman içinde değişen niteliklerin tarihsel olarak nasıl korunacağını tanımlayan veri ambarı yaklaşımı.
Yeniden Çalıştırma Stratejisi
Başarısız veya eksik veri işlerinin hangi kapsamda ve hangi güvenlik kurallarıyla tekrar çalıştırılacağını belirleyen yaklaşım.
Yükleme Penceresi
Bir yükleme sürecinin hangi zaman aralığındaki veriyi kapsadığını ve ne zaman çalıştığını tanımlayan sınır yapısı.
Yıldız Şema
Merkezde olgu tablosu, çevresinde boyut tabloları bulunan klasik analitik veri ambarı tasarımı.