# Computer Vision (Bilgisayarlı Görü) Nedir? Görüntü İşleme ve Nesne Tespiti Rehberi

> Source: https://sukruyusufkaya.com/blog/computer-vision-nedir
> Updated: 2026-07-05T14:04:23.540Z
> Type: blog
> Category: yapay-zeka
**TLDR:** Computer vision nedir? Computer vision (bilgisayarlı görü), bir makinenin görüntü ve videolardaki içeriği insan gibi algılayıp anlamlandırmasını sağlayan yapay zeka alanıdır. Bu rehber: net tanım, görüntü işleme ile farkı, computer vision nasıl çalışır, CNN ve derin öğrenme, nesne tespiti ve görüntü sınıflandırma, kurumsal kullanım alanları, KVKK ve sık sorulan sorular.

<tldr data-summary="[&quot;Computer vision (bilgisayarlı görü), bir makinenin görüntü ve videolardaki içeriği algılayıp anlamlandırmasını sağlayan yapay zeka alanıdır.&quot;,&quot;Görüntü işleme piksellerle uğraşır; bilgisayarlı görü o piksellerin ne anlama geldiğini çıkarır.&quot;,&quot;Modern bilgisayarlı görünün motoru derin öğrenmedir; özellikle CNN görüntüdeki desenleri katman katman öğrenir.&quot;,&quot;Temel görevler: görüntü sınıflandırma, nesne tespiti ve segmentasyon.&quot;,&quot;Kurumsal değer kalite kontrolünden tıbbi görüntülemeye uzanır; Türkiye'de KVKK en baştan tasarlanmalıdır.&quot;]" data-one-line="Computer vision nedir sorusunun kısa cevabı: görüntü ve videolardaki içeriği makinelerin algılayıp anlamlandırmasını sağlayan, bugün CNN gibi derin öğrenme modelleriyle çalışan yapay zeka alanı."></tldr>

Computer vision nedir? Computer vision (Türkçesiyle bilgisayarlı görü), bir makinenin dijital görüntü ve videolardaki içeriği insan gibi algılayıp anlamlandırmasını sağlayan yapay zeka alanıdır. Bir kamera piksel toplar; bilgisayarlı görü ise bu piksellerin bir yüz mü, bir ürün kusuru mu yoksa bir trafik levhası mı olduğunu çıkarır.

İnsan için bir fotoğrafa bakıp "bu bir kedi" demek anlıktır; bir makine içinse bu, milyonlarca sayının ardındaki deseni çözmek demektir. Bilgisayarlı görü tam olarak bu boşluğu doldurur: ham pikselleri anlamlı bilgiye çevirir. Bu rehber computer vision nedir, görüntü işlemeden nasıl ayrılır, nasıl çalışır, CNN ve derin öğrenmeyle ilişkisi nedir ve kurumsal olarak nerede değer ürettiğini ele alıyor.

<definition-box data-term="Computer Vision (Bilgisayarlı Görü)" data-definition="Bir makinenin dijital görüntü ve videolardaki içeriği insan gibi algılayıp anlamlandırmasını sağlayan yapay zeka alanı. Bilgisayarlı görü; nesneleri, kişileri, sahneleri ve metni tanır ve bugün büyük ölçüde CNN gibi derin öğrenme modelleriyle görüntü sınıflandırma, nesne tespiti ve segmentasyon gibi görevleri gerçekleştirir." data-also="Bilgisayarlı görü, bilgisayarla görme, makine görüsü, computer vision"></definition-box>

## Computer Vision ile Görüntü İşleme Arasındaki Fark Nedir?

İki kavram sık karıştırılır ama farkları temeldir. Görüntü işleme (image processing), bir görüntüyü piksel düzeyinde dönüştürmekle ilgilenir: parlaklığı ayarlamak, gürültüyü temizlemek, kenarları belirginleştirmek, bir filtre uygulamak. Girdi bir görüntüdür, çıktı yine bir görüntüdür. Burada henüz "anlama" yoktur; yalnızca piksellerin matematiksel dönüşümü vardır.

Bilgisayarlı görü ise bir adım öteye geçer: girdi bir görüntüdür, ama çıktı bir anlamdır — "bu bir yaya", "bu üründe çizik var", "bu belgede şu metin yazıyor". Görüntü işleme çoğu zaman bilgisayarlı görünün bir ön adımıdır; örneğin bir modeli beslemeden önce görüntü normalize edilir. Ama görüntü işleme tek başına karar üretmez. Kısaca: görüntü işleme pikseli güzelleştirir, bilgisayarlı görü pikseli yorumlar. Bu ayrımı netleştirmek, bir projede hangi araca ihtiyaç duyduğunuzu bilmenin ilk adımıdır.

## Computer Vision Nasıl Çalışır?

Modern bilgisayarlı görü, elle yazılmış kurallar yerine örneklerden öğrenmeye dayanır. Bir modele binlerce etiketli görüntü gösterilir ("bu kedi", "bu köpek") ve model, bu görüntüleri ayırt eden desenleri kendisi çıkarır. Öğrenilen bu desenler daha sonra hiç görülmemiş yeni görüntülere uygulanır. Sürecin kalbinde, ham pikselden anlamlı karara giden birkaç adım vardır.

<howto-steps data-name="Bir computer vision modelinin çalışma döngüsü" data-description="Ham bir görüntüden anlamlı bir karara kadar bilgisayarlı görünün izlediği temel adımlar." data-steps="[{&quot;name&quot;:&quot;Görüntüyü al ve hazırla&quot;,&quot;text&quot;:&quot;Görüntü sayısal bir piksel dizisine çevrilir; boyut, renk ve ölçek normalize edilir (görüntü işleme adımı).&quot;},{&quot;name&quot;:&quot;Özellikleri çıkar&quot;,&quot;text&quot;:&quot;CNN gibi bir model, kenar, doku ve şekil gibi düşük seviyeli desenlerden başlayarak katman katman daha soyut özellikler öğrenir.&quot;},{&quot;name&quot;:&quot;Görevi uygula&quot;,&quot;text&quot;:&quot;Öğrenilen özellikler; görüntü sınıflandırma, nesne tespiti veya segmentasyon gibi hedef göreve göre yorumlanır.&quot;},{&quot;name&quot;:&quot;Sonucu üret&quot;,&quot;text&quot;:&quot;Model bir etiket, bir sınırlayıcı kutu veya piksel maskesi üretir ve güven skoruyla birlikte döndürür.&quot;}]"></howto-steps>

Bu akışın kritik noktası, özellik çıkarımının artık elle yapılmamasıdır. Eski yöntemlerde mühendisler "köşe şöyle görünür, doku böyle ölçülür" diye kurallar yazardı. Derin öğrenmeyle birlikte model, hangi özelliklerin önemli olduğunu verinin kendisinden öğrenir. Bilgisayarlı görüdeki büyük sıçramanın nedeni tam olarak budur.

## CNN ve Derin Öğrenme: Bilgisayarlı Görünün Motoru

Modern bilgisayarlı görünün motoru derin öğrenmedir ve bu alanın simge mimarisi CNN'dir (Convolutional Neural Network, evrişimli sinir ağı). CNN, bir görüntüyü küçük pencerelerle tarayarak yerel desenleri yakalar: ilk katmanlar basit kenarları ve renk geçişlerini öğrenir, orta katmanlar bunları dokulara ve şekillere birleştirir, derin katmanlar ise "göz", "tekerlek", "yüz" gibi anlamlı bütünleri tanır.

Bu katmanlı yapının gücü, bir görüntünün doğal hiyerarşisiyle örtüşmesidir: karmaşık nesneler basit parçalardan oluşur. CNN bu parçaları alttan üste doğru inşa ettiği için, aynı model çok farklı görevlere uyarlanabilir. Son yıllarda transformer tabanlı görüntü modelleri (Vision Transformer, ViT) ve görüntü ile metni birlikte işleyen çok-kipli modeller de yaygınlaştı; ama CNN hâlâ bilgisayarlı görünün temel taşı olmaya devam ediyor. Derin öğrenmenin genel mantığını <a href="/blog/yapay-zeka-nedir">yapay zeka nedir</a> rehberinde daha geniş ele alıyoruz.

<callout-box data-variant="info" data-title="Neden çok fazla etiketli veri gerekir?">

Bir CNN, desenleri örneklerden öğrenir; bu yüzden binlerce hatta milyonlarca etiketli görüntüye ihtiyaç duyar. Kurumsal projelerde en büyük maliyet çoğu zaman modelin kendisi değil, kaliteli etiketli veriyi toplamak ve etiketlemektir. Transfer öğrenme, önceden eğitilmiş bir modeli az sayıda kendi verinizle uyarlayarak bu maliyeti belirgin biçimde düşürür.

</callout-box>

## Görüntü Sınıflandırma, Nesne Tespiti ve Segmentasyon

Bilgisayarlı görü tek bir görev değil, birbirini tamamlayan bir görevler ailesidir. Bir kurumsal problemin hangi göreve karşılık geldiğini bilmek, doğru çözümü seçmenin anahtarıdır.

<comparison-table data-caption="Temel computer vision görevleri, ürettikleri çıktı ve tipik kullanım" data-headers="[&quot;Görev&quot;,&quot;Ne üretir&quot;,&quot;Tipik kullanım&quot;]" data-rows="[{&quot;feature&quot;:&quot;Görüntü sınıflandırma&quot;,&quot;values&quot;:[&quot;Tüm görsele tek etiket&quot;,&quot;Kusurlu/kusursuz ürün ayrımı&quot;]},{&quot;feature&quot;:&quot;Nesne tespiti&quot;,&quot;values&quot;:[&quot;Nesnelerin etiketi + konumu (kutu)&quot;,&quot;Rafta ürün sayımı, yaya tespiti&quot;]},{&quot;feature&quot;:&quot;Segmentasyon&quot;,&quot;values&quot;:[&quot;Piksel düzeyinde sınır maskesi&quot;,&quot;Tıbbi görüntüde tümör sınırı&quot;]},{&quot;feature&quot;:&quot;OCR (metin tanıma)&quot;,&quot;values&quot;:[&quot;Görüntüdeki metin dizisi&quot;,&quot;Fatura ve kimlik okuma&quot;]}]"></comparison-table>

En sık karıştırılan ikili görüntü sınıflandırma ile nesne tespitidir. Görüntü sınıflandırma bütün bir görsele tek bir etiket verir: "bu görsel bir kedi gösteriyor". Nesne tespiti ise görselde birden fazla nesnenin hem ne olduğunu hem de nerede olduğunu bulur ve her birini bir sınırlayıcı kutuyla işaretler. Segmentasyon bir adım daha ileri gider ve nesnenin sınırını piksel piksel çizer. Bu üç görev sırasıyla artan hassasiyet ve artan hesaplama maliyeti demektir; doğru seçim, işin gerektirdiği çözünürlüğe bağlıdır.

## Computer Vision Kurumsal Olarak Nerede Kullanılır?

Bilgisayarlı görünün kurumsal değeri, insan gözünün yorulduğu, ölçeklenmediği veya yetişemediği yerlerde ortaya çıkar. Üretimde, bir kamera hattı saniyede onlarca ürünü görüntü sınıflandırma ve nesne tespiti ile denetleyip kusurluları ayırabilir; bu, kalite kontrolde insan hatasını azaltır. Perakendede raf görselleri analiz edilerek stok ve yerleşim takip edilir. Sağlıkta tıbbi görüntülerde segmentasyon, uzmanın gözden kaçırabileceği ayrıntıları işaretleyerek karar desteği sağlar.

Bunlara lojistikte plaka ve barkod okuma, tarımda dron görüntüsünden hastalık tespiti, güvenlikte anormallik algılama ve belge işlemede OCR eklenir. Ortak nokta şudur: girdi görsel, çıktı ise ölçülebilir bir iş kararıdır. Bu alanların çoğu, bir dil modeliyle birleştiğinde daha da güçlenir; örneğin bir görüntüyü anlayıp doğal dilde açıklayan çok-kipli sistemler için <a href="/blog/uretken-yapay-zeka-nedir">üretken yapay zeka nedir</a> rehberine göz atabilirsiniz. Kurumunuza özel bir bilgisayarlı görü senaryosunu hayata geçirmek için <a href="/consulting">yapay zeka danışmanlığı</a> ile başlayabilirsiniz.

## Computer Vision, KVKK ve Türkiye Bağlamı

Bilgisayarlı görü, sıklıkla insan içeren görüntülerle çalıştığı için Türkiye'de KVKK ile birlikte tasarlanmalıdır. Bir güvenlik kamerası akışında yüz tanıma, bir mağazada müşteri sayımı veya bir çağrı merkezinde kimlik doğrulama, kişisel veri hatta özel nitelikli veri işler. Bu yüzden bir bilgisayarlı görü projesinde "hangi model" sorusundan önce "hangi veri, hangi hukuki dayanakla, ne kadar süre" sorusu yanıtlanmalıdır.

Bilgisayarlı görünün bu bağlamdaki pratik ilkesi veri minimizasyonudur: mümkün olduğunda yüz yerine anonim sayım, ham görüntü yerine çıkarılmış özellik saklamak, ve kişiyi tanımlayan verileri en baştan sınırlamak. Açık rıza, aydınlatma yükümlülüğü ve erişim kontrolü, sistemin mimarisine sonradan eklenen değil, baştan gömülü bileşenler olmalıdır. Doğru kurgulandığında bilgisayarlı görü hem operasyonel değer hem de uyum sağlar; yanlış kurgulandığında ise ciddi bir uyum riskine dönüşür. Kurumsal kullanımda ekibinizi bu dengeyi kurabilecek şekilde yetiştirmek için <a href="/training">yapay zeka eğitimleri</a> yararlı bir başlangıçtır.

## Computer Vision'ın Sınırları ve Yaygın Yanılgılar

Bilgisayarlı görü güçlüdür ama sınırsız değildir. En yaygın yanılgı, bir modelin "gördüğünü anladığını" sanmaktır. Model aslında istatistiksel desen eşleştirir; eğitim verisine benzemeyen bir sahnede beklenmedik biçimde yanılabilir. Alışılmadık ışık, açı, çözünürlük veya daha önce hiç görmediği bir nesne, güvenle yanlış cevap üretmesine yol açabilir.

İkinci önemli sınır önyargıdır: model yalnızca gördüğü veriden öğrenir, dolayısıyla eğitim verisi dengesizse belirli gruplarda veya koşullarda sistematik olarak daha kötü çalışır. Üçüncüsü, bir modelin ürettiği güven skoru, gerçekten doğru olduğunu garanti etmez. Bu yüzden kritik kararlarda bilgisayarlı görü, insanı devre dışı bırakan değil, insanı destekleyen bir katman olarak tasarlanmalıdır. Bu sınırları bilmek, computer vision nedir sorusunu yalnızca teknik değil, sorumlu bir şekilde yanıtlamanın parçasıdır.

## Sıkça Sorulan Sorular

### Computer vision ile görüntü işleme arasındaki fark nedir?

Görüntü işleme, bir görüntüyü piksel düzeyinde dönüştürmekle ilgilenir: kontrastı artırmak, gürültüyü temizlemek, kenar bulmak. Computer vision ise bir adım öteye geçer ve o görüntünün ne anlama geldiğini çıkarır: bu bir yaya mı, bu üründe çizik var mı. Görüntü işleme çoğu zaman bilgisayarlı görünün bir ön adımıdır, ama tek başına 'anlama' üretmez.

### Computer vision hangi yapay zeka teknolojisiyle çalışır?

Modern bilgisayarlı görü büyük ölçüde derin öğrenmeyle, özellikle CNN (evrişimli sinir ağı) mimarisiyle çalışır. CNN, bir görüntüdeki kenar, doku ve şekil gibi desenleri katman katman öğrenir. Son yıllarda transformer tabanlı görüntü modelleri (ViT) ve görüntü-metin birlikte çalışan çok-kipli modeller de yaygınlaşmıştır.

### Nesne tespiti ile görüntü sınıflandırma aynı şey mi?

Hayır. Görüntü sınıflandırma bütün bir görsele tek bir etiket verir ('bu bir kedi'). Nesne tespiti ise görselde birden fazla nesnenin hem ne olduğunu hem de nerede olduğunu (sınırlayıcı kutu) bulur ('sol üstte bir kedi, sağ altta bir köpek'). Nesne tespiti, sınıflandırmaya konum bilgisi ekleyen daha zengin bir görevdir.

### Küçük bir kurum computer vision'a nasıl başlar?

En sağlıklı yol, tek ve ölçülebilir bir problemle başlamaktır: örneğin bir üretim hattında belirli bir kusur tipini tespit etmek. Hazır önceden eğitilmiş modelleri kendi az sayıda etiketli verinizle uyarlamak (transfer öğrenme), sıfırdan model eğitmekten çok daha hızlı ve ucuzdur. Küçük bir pilotla değeri kanıtlayıp ölçeklendirmek riski düşürür.

## Özetle: Computer Vision Nedir?

Özetle computer vision nedir sorusunun cevabı şudur: bir makinenin görüntü ve videolardaki içeriği algılayıp anlamlandırmasını sağlayan yapay zeka alanı. Görüntü işleme pikselleri hazırlar; bilgisayarlı görü ise CNN gibi derin öğrenme modelleriyle o piksellerin ne anlama geldiğini çıkarır ve görüntü sınıflandırma, nesne tespiti ve segmentasyon gibi görevleri gerçekleştirir. Kurumsal değeri kalite kontrolünden tıbbi görüntülemeye kadar uzanır, ama Türkiye'de KVKK en baştan tasarlanmalıdır. Temel için <a href="/blog/yapay-zeka-nedir">yapay zeka nedir</a> ve <a href="/blog/llm-nedir">LLM nedir</a> rehberlerine göz atabilir, kurumsal bir bilgisayarlı görü projesi için <a href="/consulting">yapay zeka danışmanlığı</a> ile başlayabilirsiniz.

<!-- İÇ BAĞLANTI BORCU: /blog/derin-ogrenme-nedir, /blog/sinir-agi-nedir, /blog/cnn-nedir, /blog/coklu-kipli-yapay-zeka-nedir, /blog/ocr-nedir yayınlanınca eklenecek. -->