Veri Bilimi ve Veri Yönetimi
Veri Bilimi ve Veri Yönetimi alanındaki 98 terim — her biri Türkçe-İngilizce tanımlı, ilgili kavramlara bağlı.
En Çok Okunanlar
Tüm Terimler (98)
Agregasyon Özelliği
Bireysel kayıtları daha üst seviyede özetleyerek model için yeni anlamlı sinyaller üreten özellik yapısı.
Aktif Etiketleme
Modelin en faydalı veya en belirsiz örnekleri seçerek etiketleme maliyetini optimize etmeyi amaçlayan yaklaşım.
Akış Verisi Toplama
Sürekli üretilen verilerin anlık veya anlığa yakın biçimde sisteme alınması yaklaşımı.
Annotatörler Arası Uyum
Farklı etiketleyicilerin aynı veri örneğine ne ölçüde benzer karar verdiğini gösteren kalite ölçüsü.
Anonimleştirme
Kişisel verilerin belirli bir bireyle yeniden ilişkilendirilemeyecek şekilde dönüştürülmesi süreci.
Aykırı Değer
Veri kümesinin genel örüntüsünden belirgin biçimde ayrılan gözlem veya değer.
Azaltılmış Örnekleme
Baskın sınıfın örnek sayısını azaltarak sınıf dağılımını daha dengeli hale getirme yaklaşımı.
Aşırı Örnekleme
Az temsil edilen sınıfı veri kümesinde daha görünür hale getirmek için örnek sayısını artırma yaklaşımı.
Dengeli Batch Örnekleme
Eğitim sırasında her batch içinde sınıf dağılımını daha kontrollü tutarak öğrenmeyi dengeleyen örnekleme stratejisi.
Dengesizlik Duyarlı Kalibrasyon
Dengesiz sınıf yapısında model olasılıklarının gerçek risk seviyelerini daha doğru yansıtmasını sağlama yaklaşımı.
Diferansiyel Gizlilik
Tek bir bireyin verisinin sonuçları anlamlı biçimde değiştirmesini sınırlayan matematiksel gizlilik çerçevesi.
Diffusion Tabanlı Sentetik Veri
Gürültü ekleme ve geri örnekleme mantığıyla veri dağılımını yeniden inşa eden modern sentetik veri üretim yaklaşımı.
Domain Randomization
Sentetik veri üretiminde çevresel değişkenleri çeşitlendirerek modelin gerçek dünyaya daha dayanıklı hale getirilmesi yaklaşımı.
Doğruluk
Bir veri alanının gerçek dünya değerini ne kadar doğru yansıttığını ifade eden kalite boyutu.
Eksik Veri
Bir gözlemde bulunması beklenen alanların boş, null veya bilinmeyen olarak yer alması durumu.
Eksik Veri Doldurma
Eksik gözlemlerin istatistiksel, kurallı veya model tabanlı yöntemlerle tamamlanması süreci.
Enstrümantasyon Tasarımı
Ürün, süreç veya sistem davranışlarını doğru ölçebilmek için hangi olayların ve alanların nasıl kaydedileceğini tanımlayan tasarım yaklaşımı.
Entity Resolution
Farklı kayıtların gerçekte aynı varlığı temsil edip etmediğini belirlemeye yönelik eşleştirme ve birleştirme süreci.
Etiket Ontolojisi
Etiketlerin hiyerarşik, ilişkisel ve kavramsal yapısını tanımlayan sınıflandırma çerçevesi.
Etiketleme Rehberi
Etiketleme sürecinde hangi kuralların, örneklerin ve istisnaların uygulanacağını tanımlayan resmi yönerge dokümanı.
Etkileşim Özelliği
İki veya daha fazla özelliğin birlikte etkisini yansıtmak için oluşturulan birleşik değişken.
Eşik Kaydırma
Dengesiz sınıflarda sınıf tahmin eşiğini iş hedefi ve hata maliyetine göre ayarlama yaklaşımı.
GAN Tabanlı Sentetik Veri
Üretici-karşıt ağlar kullanılarak gerçek dağılıma benzer yeni veri örnekleri üretilmesine dayanan sentetik veri yaklaşımı.
Gecikmeli Özellik
Geçmiş zaman adımlarındaki değerleri kullanarak zaman bağımlı örüntüleri modele taşıyan özellik türü.
Geçerlilik
Bir veri değerinin tanımlı format, aralık, sözlük veya iş kuralına uygun olup olmadığını ifade eden kalite boyutu.
Gizlilik Bütçesi
Diferansiyel gizlilik uygulamalarında ne kadar gizlilik kaybına izin verileceğini nicel olarak yöneten kavram.
Gizlilik Korumalı Sentetik Veri
Gerçek bireyleri ifşa etmeden analitik değer üretmeyi hedefleyen sentetik veri üretim yaklaşımı.
Ground Truth
Bir veri örneği için doğru kabul edilen referans etiket veya doğrulama bilgisi.
Güncellik
Verinin ihtiyaç duyulan anda yeterince güncel, zamanında ve kullanılabilir durumda olması özelliği.
Kanonikleştirme
Aynı bilgiyi taşıyan farklı veri gösterimlerinin tek ve standart bir biçime dönüştürülmesi işlemi.
Kategori Standardizasyonu
Aynı kavramı temsil eden farklı yazım, kısaltma veya formatların tek bir standart biçimde birleştirilmesi işlemi.
Kayan Pencere Özellikleri
Belirli bir zaman penceresindeki geçmiş gözlemleri özetleyerek zaman bağımlı sinyaller üreten özellik yapısı.
Kayıt Bağlama
Aynı kişiye, kuruma veya olaya ait kayıtların farklı veri kaynakları arasında ilişkilendirilmesi süreci.
Kod Olarak Politika
Veri erişim, kullanım ve güvenlik politikalarının manuel süreçler yerine kodla tanımlanıp uygulanması yaklaşımı.
Kodlama (Encoding)
Kategorik verilerin modellerin işleyebileceği sayısal temsillere dönüştürülmesi işlemi.
Kural Tabanlı Veri Temizleme
Veri kalitesini iyileştirmek için açık iş kuralları ve doğrulama koşulları üzerinden çalışan temizlik yaklaşımı.
k-Anonimlik
Her bireyin en az k kişiyle ayırt edilemez olmasını hedefleyen gizlilik koruma modeli.
Master Data Management
Müşteri, ürün, tedarikçi gibi temel kurumsal varlıkların tekilleştirilmiş ve tutarlı biçimde yönetilmesi yaklaşımı.
Metadata Yönetimi
Veri hakkında veri niteliğindeki tanım, kaynak, kullanım ve teknik yapı bilgilerinin sistematik yönetimi.
Mode Collapse
Sentetik veri üreten modelin dağılımdaki çeşitliliği kaybedip sınırlı türde örnekler üretmesi problemi.
Monotonik Binning
Sürekli değişkenleri hedefle düzenli yönlü ilişki koruyacak şekilde aralıklara ayıran özellik dönüştürme tekniği.
Mutabakat Kontrolü
Farklı veri sistemleri veya katmanları arasında kayıt, toplam ve iş mantığı uyumunu doğrulama süreci.
Ön İşleme Pipeline'ı
Veri dönüşüm adımlarının sıralı, tekrar üretilebilir ve otomasyona uygun biçimde kurgulanmış akışı.
Örnekleme Çerçevesi
Hangi birimlerin örnekleme sürecine dahil edilebileceğini tanımlayan kaynak liste veya kapsama yapısı.
Özellik Seçimi
Model için en bilgilendirici değişkenleri seçerek gürültüyü, maliyeti ve karmaşıklığı azaltma süreci.
SMOTE
Azınlık sınıfı için mevcut örnekler arasından yeni sentetik örnekler oluşturan yaygın dengelenme tekniği.
Saklama Politikası
Verinin ne kadar süre tutulacağını, ne zaman arşivleneceğini veya silineceğini tanımlayan yönetişim ilkesi.
Sentetik Veri
Gerçek veri dağılımını taklit edecek biçimde yapay olarak üretilen ve analiz veya modelleme amacıyla kullanılan veri.
Sentetik Veri Fidelity
Sentetik verinin gerçek verinin istatistiksel, yapısal ve kullanım amaçlı özelliklerini ne kadar iyi koruduğunu gösteren nitelik.
Sentetik Veri Sızıntısı
Sentetik verinin gerçek veriden aşırı iz taşıması nedeniyle mahremiyet veya üyelik bilgisini sızdırma riski.
Simülasyon Verisi
Gerçek sistemlerin davranışını matematiksel veya kurallı modeller üzerinden taklit ederek üretilen veri.
Standartlaştırma
Bir değişkeni ortalaması sıfır ve standart sapması bir olacak şekilde dönüştürme işlemi.
Sınıf Ağırlıklandırma
Az temsil edilen sınıfların hata maliyetini artırarak modelin karar öğrenmesini yeniden dengeleyen yaklaşım.
Sınıf Dengesizliği
Bir veri kümesinde bazı sınıfların çok baskın, bazılarının ise çok az temsil edilmesi durumu.
Sızıntı Duyarlı Özellik Mühendisliği
Özellik üretimini zaman, hedef ve operasyonel kullanım sınırlarını koruyacak şekilde tasarlama yaklaşımı.
Takma Adlaştırma
Kimlik bilgilerini doğrudan kaldırmak yerine, kontrollü ek bilgilerle geri bağlanabilecek takma temsillere dönüştürme yaklaşımı.
Tamlık
Bir veri kümesinde beklenen alanların, kayıtların veya iş kapsamının ne ölçüde eksiksiz bulunduğunu ifade eden kalite boyutu.
Target Encoding
Kategorik sınıfları hedef değişkenle ilişkili özet istatistikler üzerinden sayısal temsillere dönüştüren gelişmiş özellik mühendisliği tekniği.
Tek Sınıf Sınıflandırma
Azınlık sınıfın çok nadir olduğu durumlarda normal örüntüyü öğrenip sapmaları anormal kabul eden modelleme yaklaşımı.
Train-Serve Skew
Modelin eğitimde gördüğü veri ile üretim anında karşılaştığı veri arasında oluşan dönüşüm veya içerik farkı.
Türetilmiş Özellik
Ham veriden doğrudan gelmeyen, mevcut alanlardan hesaplanan veya dönüştürülen yeni özellik.
t-Yakınlığı
Anonim gruplardaki hassas veri dağılımlarının genel veri kümesine yeterince yakın kalmasını hedefleyen model.
Veri Gözlemlenebilirliği
Veri hatalarını, anormallikleri ve sessiz kalite bozulmalarını erken fark etmeyi amaçlayan izleme yaklaşımı.
Veri Kataloğu
Kurumsal veri varlıklarının tanım, sahiplik, kullanım ve keşif bilgisini merkezi biçimde sunan katalog yapısı.
Veri Kaynağı
Verinin üretildiği, saklandığı veya çekildiği sistem, platform ya da operasyonel temas noktası.
Veri Lineage
Bir veri öğesinin kaynaktan rapora veya modele kadar geçtiği tüm dönüşüm ve hareket izinin görünür kılınması.
Veri Minimizasyonu
Belirli bir amaç için yalnızca gerçekten gerekli olan verinin toplanması ve işlenmesi ilkesi.
Veri Profilleme
Bir veri kümesinin içerik, dağılım, boşluk, benzersizlik ve kural ihlali yapısını sistematik olarak inceleme süreci.
Veri Sahipliği
Belirli veri alanlarının kalite, tanım ve kullanım sorumluluğunun hangi iş veya teknik rolde olduğunu tanımlayan ilke.
Veri Stewardship
Belirli veri alanlarının tanım, kalite ve kullanım disiplininin operasyonel olarak sahiplenilmesi yaklaşımı.
Veri Sözleşmeleri
Veri üreten ve tüketen taraflar arasında şema, kalite ve teslim beklentilerini açıkça tanımlayan anlaşma yaklaşımı.
Veri Sızıntısı Önleme
Model eğitimi sırasında gerçek kullanım anında bulunmayacak bilginin öğrenmeye sızmasını engelleyen ön işleme disiplini.
Veri Tipi Uyumsuzluğu
Bir alanın beklenen veri tipi ile kaydedilen gerçek içerik tipi arasında oluşan uyumsuzluk problemi.
Veri Toplama
Analiz, raporlama ve modelleme süreçlerinde kullanılacak verilerin sistematik biçimde elde edilmesi süreci.
Veri Toplama SLA'sı
Veri akışlarının zamanlılık, eksiksizlik ve erişilebilirlik standartlarını tanımlayan operasyonel hizmet seviyesi çerçevesi.
Veri Yönetişimi
Verinin sahiplik, kalite, erişim, kullanım ve denetim ilkeleriyle kurumsal ölçekte yönetilmesi çerçevesi.
Veri Çoğaltma
Mevcut verileri dönüştürerek eğitim kümesini genişletme ve model dayanıklılığını artırma yaklaşımı.
Weak Supervision
Tam manuel etiketleme yerine kurallar, heuristikler veya zayıf kaynaklar üzerinden yaklaşık etiket üretme yaklaşımı.
Web Scraping
Web sayfalarındaki yapılandırılmış veya yarı yapılandırılmış verilerin programatik olarak toplanması yöntemi.
Winsorization
Aşırı uç değerlerin tamamen silinmesi yerine belirli eşiklerde sınırlandırılması yaklaşımı.