Skip to content
Bilgisayarlı Görü 30 dk

Object Detection, Segmentation ve Image Classification Arasındaki Farklar ve Kullanım Alanları

Bilgisayarlı görü projelerinde en kritik tasarım kararlarından biri, problemin hangi görev ailesi olarak tanımlanacağıdır. Çünkü image classification, object detection ve segmentation aynı görsel veriyi kullanıyor gibi görünse de, çözmeye çalıştıkları problem, ürettikleri çıktı tipi, hata maliyeti, veri etiketleme ihtiyacı, hesaplama profili ve üretim kullanım biçimi açısından ciddi biçimde farklılaşır. Bir üründe yalnızca “görüntüde ne var?” sorusunun cevabı yeterliyse image classification en doğru yaklaşım olabilir; ancak “nerede var?” sorusu devreye girdiğinde object detection gerekir. Eğer ihtiyaç “hangi piksel hangi nesneye ait?” düzeyindeyse segmentation yaklaşımı devreye girer. Bu kapsamlı rehberde, image classification, object detection ve segmentation görevlerini teorik, metodolojik ve uygulamalı açıdan karşılaştırıyor; hangi problemde hangi yaklaşımın daha doğru olduğunu, veri ve etiketleme gereksinimlerini, tipik hata kalıplarını ve endüstriyel kullanım alanlarını detaylı biçimde inceliyoruz.

SYK

YAZAR

Şükrü Yusuf KAYA

4

Object Detection, Segmentation ve Image Classification Arasındaki Farklar ve Kullanım Alanları

Bilgisayarlı görü projelerinde en kritik ama en sık hafife alınan karar, probleme hangi görev ailesiyle yaklaşılacağının doğru seçilmesidir. Çünkü birçok ekip görsel veriyi gördüğünde doğrudan model mimarisi tartışmasına geçer: CNN mi, Vision Transformer mı, daha büyük backbone mu, daha hızlı inference mı? Oysa bundan daha temel bir soru vardır: Bu görsel problem aslında hangi çıktıyı gerektiriyor? Yani sistemin sadece görüntüde ne olduğunu mu söylemesi gerekiyor, görüntüdeki nesnelerin nerede olduğunu da mı bulması gerekiyor, yoksa her pikselin hangi nesneye ait olduğunu mu ayırması bekleniyor? Bu soru doğru cevaplanmadan yapılan model seçimi çoğu zaman yönsüz kalır.

Image classification, object detection ve segmentation aynı veri dünyasında yaşar; ama aynı problem değildir. Image classification, bir görselin genel içeriğini etiketler. Object detection, görsel içindeki nesnelerin sınıfını ve yaklaşık konumunu belirler. Segmentation ise nesneleri yalnızca kutu içine almakla kalmaz; piksel düzeyinde ayırır. Bu fark teknik açıdan küçük görünse de, pratikte veri etiketleme maliyetinden model karmaşıklığına, inference gereksiniminden iş etkisine kadar her şeyi değiştirir.

Örneğin bir üretim hattında amaç yalnızca “ürün kusurlu mu değil mi?” demekse image classification yeterli olabilir. Ancak hangi bölgenin kusurlu olduğunu operatöre göstermek gerekiyorsa detection veya segmentation gerekir. Bir güvenlik kamerasında sahada insan var mı yok mu sorusu belirli durumlarda sınıflandırma ile ele alınabilir; ama insanın tehlikeli bölgeye girip girmediğini anlamak için detection gerekir. Tıbbi görüntülemede tümörün yalnızca varlığı değil, tam sınırı önemliyse segmentation zorunlu hale gelir. Yani görev seçimi doğrudan iş değerini ve sistem tasarımını belirler.

Bu yazıda image classification, object detection ve segmentation görevlerini sistematik biçimde karşılaştıracağım. Önce bu üç yaklaşımın temel mantığını açıklayacağım. Ardından çıktı yapısı, etiketleme stratejisi, veri maliyeti, hesaplama ihtiyacı, değerlendirme mantığı, tipik hata kalıpları ve gerçek dünya kullanım alanları açısından detaylı analiz yapacağım. Son bölümde ise hangi use-case’te hangi yaklaşımın daha doğru olduğuna dair pratik bir karar çerçevesi sunacağım. Amaç, “hangisi daha güçlü?” gibi yüzeysel bir sorudan çok, “hangi problem hangi görev ailesi olarak tanımlanmalı?” sorusuna net yanıt vermektir.

Neden Bu Üç Görevi Birbirinden Net Şekilde Ayırmak Gerekir?

Bilgisayarlı görüde birçok problem yanlış görev formuna döküldüğü için gereğinden pahalı, gereğinden karmaşık veya gereğinden zayıf sistemler ortaya çıkar. Çünkü bazı problemler için segmentation kullanmak teknik olarak mümkün olsa da gereksiz olabilir. Bazı problemlerde ise classification kurmak kolay görünür; ama sistemin gerçek ihtiyacını karşılamaz. Doğru görev seçimi, model başarımından önce problem soyutlaması başarısıdır.

Bu ayrımı netleştirmek için şu üç soruyu düşünmek faydalıdır:

  • Image Classification: Bu görüntü genel olarak hangi sınıfa ait?
  • Object Detection: Bu görüntüde hangi nesneler var ve yaklaşık olarak nerede?
  • Segmentation: Görüntünün hangi pikseli hangi nesne veya bölgeye ait?

Bu üç sorunun her biri daha yüksek detay düzeyine çıkar. Yani classification en genel düzeyde karar verir, detection uzamsal konum bilgisi ekler, segmentation ise uzamsal ayrımı en ince seviyeye taşır.

"

Kritik gerçek: Görü problemlerinde en iyi görev, en detaylı görev olmak zorunda değildir. En doğru görev, iş ihtiyacını minimum gereksiz karmaşıklıkla karşılayan görevdir.

1. Image Classification Nedir?

Image classification, bir görüntüye bir ya da birden fazla etiket atama problemidir. Model görselin tamamını giriş olarak alır ve bu görselin hangi sınıfa ait olduğunu tahmin eder. Çıktı genellikle tek etiketli sınıflandırma, çok etiketli sınıflandırma veya olasılık dağılımı biçimindedir.

Classification’ın Temel Mantığı

  • Görüntü bütün olarak değerlendirilir
  • Nesnenin tam konumu açıkça verilmez
  • Ana amaç, sınıf kararını doğru vermektir

Tipik Kullanım Senaryoları

  • Bir röntgende hastalık var mı yok mu?
  • Bu ürün kusurlu mu değil mi?
  • Bu yaprak hastalıklı mı sağlıklı mı?
  • Bu görüntüde kedi mi köpek mi var?
  • Bu belge türü fatura mı sözleşme mi?

Classification’ın Güçlü Yanları

  • En düşük etiketleme maliyetlerinden birine sahiptir
  • Görece daha hızlı eğitilebilir ve çalıştırılabilir
  • Edge ve mobil cihazlarda daha rahat deploy edilebilir
  • Birçok problem için yeterli karar katmanı sunar

Sınırları

  • Görüntüde nesnenin nerede olduğunu söylemez
  • Birden fazla nesne veya lokal anomali olduğunda yetersiz kalabilir
  • Kararın hangi bölgeden geldiğini açıkça vermediği için operasyonel açıklanabilirlik sınırlı olabilir

Dolayısıyla classification, “görüntünün genel durumu nedir?” sorusu için çok güçlüdür; ama uzamsal lokalizasyon gereken durumlarda bir üst görev ailesine geçmek gerekir.

2. Object Detection Nedir?

Object detection, bir görüntüdeki nesnelerin hem sınıfını hem de konumunu belirlemeyi amaçlar. Model yalnızca “görüntüde kedi var” demez; aynı zamanda kedinin görselde yaklaşık hangi bölgede bulunduğunu da söyler. Bu konum genellikle bounding box ile temsil edilir.

Detection’ın Temel Mantığı

  • Görüntü içindeki birden fazla nesne ayrı ayrı bulunabilir
  • Her nesne için sınıf + konum bilgisi üretilir
  • Çıktı çoğu zaman kutu koordinatları ve güven skorlarıdır

Tipik Kullanım Senaryoları

  • Güvenlik kamerasında insan, araç ve forklift tespiti
  • Raf üzerindeki ürünlerin sayımı
  • Üretim hattında eksik parça veya yanlış yerleştirme tespiti
  • Trafik sahnesinde araç, yaya ve trafik işareti bulma
  • Tarımda meyve sayımı veya hastalıklı bölgeye yakın nesne tespiti

Detection’ın Güçlü Yanları

  • Classification’a göre daha zengin operasyonel bilgi sunar
  • Birden fazla nesneyi aynı karede ayrı ayrı ele alabilir
  • Sayım, takip, bölge ihlali ve süreç doğrulama gibi use-case’ler için uygundur
  • Alarm ve aksiyon mantıklarına kolay bağlanır

Sınırları

  • Segmentation kadar hassas sınır bilgisi vermez
  • Küçük, üst üste binen veya yoğun sahnelerde zorlanabilir
  • Bounding box, gerçek nesne şekliyle tam örtüşmediği için bazı use-case’lerde kaba kalabilir

Detection, “görüntüde ne var ve nerede var?” sorusunun doğal cevabıdır. Ancak nesne sınırlarının piksel hassasiyetinde bilinmesi gerekiyorsa segmentation gerekir.

3. Segmentation Nedir?

Segmentation, görüntüdeki her pikselin hangi sınıfa veya hangi nesneye ait olduğunu belirleme problemidir. Bu görev, görseli en ayrıntılı biçimde yorumlayan temel görü görevlerinden biridir. Bounding box yaklaşımından farklı olarak, nesnenin yalnızca yaklaşık konumunu değil, gerçek alanını ve sınırlarını belirlemeyi hedefler.

Segmentation Türleri

Semantic Segmentation

Her pikseli bir sınıfa atar. Aynı sınıftan iki farklı nesne birbirinden ayrılmayabilir; ama “bu piksel yol, bu piksel insan, bu piksel araç” gibi sınıf ataması yapılır.

Instance Segmentation

Aynı sınıfa ait nesneleri de birbirinden ayırır. Yani iki ayrı insan ya da iki ayrı araç sadece aynı sınıf etiketiyle değil, ayrı örnekler olarak işaretlenir.

Panoptic Segmentation

Hem semantic hem instance bakışını birleştiren daha kapsamlı yaklaşımdır.

Tipik Kullanım Senaryoları

  • Tıbbi görüntülemede tümör veya organ sınırı belirleme
  • Otonom sürüşte yol, kaldırım, araç, yaya ve şerit ayrımı
  • Yüzey kusurlarının tam alanını işaretleme
  • Tarımda bitki, yaprak ve yabancı ot ayrımı
  • Uydu görüntüsünde bina, yol, su ve arazi sınıfları ayırma

Segmentation’ın Güçlü Yanları

  • En yüksek uzamsal hassasiyeti sunar
  • Nesne alanı, şekli ve sınırı hakkında detaylı bilgi verir
  • Alan ölçümü, hacim tahmini ve hassas bölge analizi için uygundur
  • Detection’ın kaba kaldığı uygulamalarda operasyonel avantaj sağlar

Sınırları

  • Etiketleme maliyeti çok yüksektir
  • Model ve eğitim karmaşıklığı daha fazladır
  • Inference maliyeti classification’a göre genellikle daha yüksektir
  • Her problem için gerekli değildir; gereksiz kullanıldığında maliyet üretir

Segmentation, “nerede?” sorusunun ötesine geçip “tam olarak hangi pikseller?” sorusunu çözer. Bu nedenle yüksek detay gereken use-case’lerde vazgeçilmezdir; fakat gereksiz kullanım durumunda pahalı bir aşırı çözüm olabilir.

Bu Üç Görev Arasında En Temel Fark Çıktı Yapısıdır

Bu görevleri en net biçimde ayıran şey, modelin ürettiği çıktı biçimidir.

Image Classification Çıktısı

  • Tek etiket veya çoklu etiket
  • Örnek: “kusurlu”, “kedi”, “fatura”, “yangın var”

Object Detection Çıktısı

  • Sınıf + bounding box + güven skoru
  • Örnek: “insan: x1,y1,x2,y2”

Segmentation Çıktısı

  • Piksel maskesi veya piksel sınıf haritası
  • Örnek: görüntüdeki her pikselin etiketlenmesi

Bu fark yalnızca teknik çıktı biçimi değil; sistemin iş akışına nasıl bağlanacağını da belirler. Etiket gerekiyorsa classification yeterlidir. Bölge bazlı alarm gerekiyorsa detection daha uygundur. Alan ölçümü veya hassas kontur gerekiyorsa segmentation gerekir.

Etiketleme Maliyeti Açısından Nasıl Ayrışırlar?

Bu üç görev arasındaki en pratik farklardan biri annotation maliyetidir.

Classification Etiketleme

En ucuz ve en hızlı etiketleme türlerinden biridir. Görsele tek etiket atanır.

Detection Etiketleme

Daha pahalıdır; çünkü nesnelerin sınır kutuları çizilir. Bir görselde birden fazla nesne varsa etiketleme süresi artar.

Segmentation Etiketleme

En maliyetli ve zaman alıcı annotation türüdür. Piksel düzeyinde maskeler gerektiği için uzman emeği ve kalite kontrol ihtiyacı yüksektir.

Bu yüzden bazı projelerde teknik olarak segmentation daha güçlü olsa bile, veri maliyeti nedeniyle classification veya detection tercih edilir. Görev seçimi burada yalnızca teknik değil, ekonomik karardır.

Hesaplama ve Deployment Açısından Farklar Nelerdir?

Genel eğilim olarak classification en hafif görevdir. Detection daha ağırdır, segmentation ise çoğu senaryoda en pahalı görev ailesidir. Bunun sebebi, üretilen çıktı hacmi ve uzamsal hassasiyet seviyesidir.

Classification

  • Düşük latency gerektiren sistemlere daha uygundur
  • Mobil ve edge deployment için avantajlıdır

Detection

  • Orta seviye karmaşıklık sunar
  • Gerçek zamanlı kullanım için optimize edilmiş çok sayıda model ailesi vardır

Segmentation

  • Daha yüksek bellek ve işlem ihtiyacı yaratabilir
  • Gerçek zamanlı kullanım daha dikkatli tasarım gerektirir

Dolayısıyla “en detaylı olanı kuralım” yaklaşımı, düşük gecikme ve yüksek throughput gerektiren ortamlarda yanlış mimari tercihe yol açabilir.

Tipik Hata Kalıpları Nasıl Farklılaşır?

Image Classification Hataları

  • Arka plan korelasyonuna aşırı bağımlılık
  • Nesne küçükse veya sahnede kayıksa yanlış sınıf verme
  • Görüntüde birden fazla nesne olduğunda baskın olanı öğrenme
  • Lokal kusur çok küçükse tüm görüntü etiketi içinde kaybolma

Object Detection Hataları

  • Küçük nesneleri kaçırma
  • Yakın nesneleri tek kutu gibi görme
  • Çift sayım veya eksik sayım
  • Sınıf doğru olsa da kutunun yanlış yerde olması

Segmentation Hataları

  • Boundary hataları
  • İnce yapıları kaçırma
  • Nesne ile arka plan ayrımında sızıntı
  • Aynı sınıfa ait örneklerin birleşmesi veya yanlış ayrılması

Bu fark, değerlendirme metriklerinin de neden farklı olması gerektiğini açıklar.

Değerlendirme Mantığı Göreve Göre Nasıl Değişir?

Classification İçin

  • Accuracy
  • Precision / Recall / F1
  • Confusion matrix
  • Class-wise performance

Detection İçin

  • mAP
  • IoU tabanlı eşleşme
  • Precision-recall eğrileri
  • Küçük / orta / büyük nesne performansı

Segmentation İçin

  • IoU / mIoU
  • Dice score
  • Boundary F-score
  • Class-wise mask doğruluğu

Aynı görsel problem farklı görev formuna sokulduğunda, yalnızca model değil değerlendirme mantığı da tamamen değişir. Bu nedenle görev seçimi, metrik seçimini de belirler.

Hangi Problemde Hangi Görev Daha Doğrudur?

Image Classification Daha Doğruysa

  • Karar global ise
  • Nesnenin tam yeri gerekmiyorsa
  • Düşük maliyetli ve hızlı sistem isteniyorsa
  • Etiketleme bütçesi sınırlıysa
  • İş akışında sadece bayrak / sınıf bilgisi yeterliyse

Object Detection Daha Doğruysa

  • Nesnelerin nerede olduğu bilinmek isteniyorsa
  • Sayım, takip veya bölge ilişkisi önemliyse
  • Bir görüntüde birden fazla nesne varsa
  • Alarm sistemi kutu bazlı mantıkla çalışacaksa

Segmentation Daha Doğruysa

  • Nesne sınırı kritikse
  • Alan ölçümü gerekiyorsa
  • Piksel hassasiyetinde ayrım isteniyorsa
  • Tıbbi, endüstriyel veya bilimsel kullanım yüksek detay gerektiriyorsa

Gerçek Dünya Use-Case Karşılaştırmaları

Perakendede Raf Görseli

  • “Raf dolu mu boş mu?” → classification
  • “Hangi ürünler rafta var?” → detection
  • “Rafta ne kadar alan hangi ürüne ait?” → segmentation

Endüstriyel Kalite Kontrol

  • “Ürün kusurlu mu?” → classification
  • “Kusur hangi bölgede?” → detection
  • “Kusurun tam sınırı ve yüzeyi ne kadar?” → segmentation

Tıbbi Görüntüleme

  • “Tümör şüphesi var mı?” → classification
  • “Lezyon nerede?” → detection
  • “Lezyon hacmi ve sınırı nedir?” → segmentation

Güvenlik Kamerası

  • “Sahnede insan var mı?” → classification bazı dar durumlarda mümkündür
  • “İnsan tehlikeli bölgede mi?” → detection gerekir
  • “İnsan ve ekipman alanı ne kadar örtüşüyor?” → segmentation veya gelişmiş scene understanding gerekebilir

Bu Üç Görev Birlikte Kullanılabilir mi?

Evet. Gerçek sistemlerde çoğu zaman bu görevler ardışık ya da hibrit biçimde birlikte kullanılır.

  • Önce classification ile ön filtreleme yapılabilir, sonra detection devreye girer
  • Detection ile aday bölge bulunur, sonra segmentation ile hassas sınır çıkarılır
  • Segmentation çıktısından sonra sınıflandırma veya ölçüm katmanı eklenebilir

Örneğin medikal görüntülemede önce görüntü anormal mi diye sınıflandırma yapılabilir, sonra lezyon bölgesi detection ile bulunur, ardından tam segmentasyon yapılır. Bu tür hibrit tasarımlar, tek görev seçmek kadar stratejik olabilir.

En Sık Yapılan Hatalar

  1. Localization gereken problemi classification ile çözmeye çalışmak
  2. Etiketleme bütçesini düşünmeden segmentation seçmek
  3. Detection gereken yerde gereksiz ağır segmentation kurmak
  4. Global kusur problemini detection ile gereksiz karmaşıklaştırmak
  5. Çıktı tipi ile iş ihtiyacını eşleştirmemek
  6. Değerlendirme metriğini görev tipine göre özelleştirmemek
  7. Birden fazla nesneli sahnede classification skoruna güvenmek
  8. Segmentation’ın her zaman daha iyi çözüm olduğunu sanmak
  9. Deployment maliyetini görev seçiminin dışında bırakmak
  10. Hibrit çözüm gerektiren yerde tek görev ısrarı yapmak

Pratik Karar Matrisi

Problem SorusuDoğru Başlangıç YaklaşımıNeden?
Bu görüntü hangi sınıfa ait?Image ClassificationGlobal etiket yeterli
Bu görüntüde hangi nesneler var ve nerede?Object DetectionSınıf + konum bilgisi gerekli
Bu nesnenin tam sınırı ve alanı nedir?SegmentationPiksel hassasiyeti gerekli
Önce kusurlu ürünü elemek, sonra kusur alanını bulmakClassification + DetectionHibrit ve verimli akış
Nesneyi bulup sonra sınırını netleştirmekDetection + SegmentationÖnce lokalizasyon, sonra hassas ayrım

Kurumsal Takımlar için Stratejik Tasarım İlkeleri

1. Görevi Çıktı İhtiyacına Göre Tanımla

Etiket mi, kutu mu, maske mi? Karar burada başlar.

2. En Detaylı Görevi Otomatik En Doğru Görev Sanma

Fazla detay, fazla maliyet ve fazla karmaşıklık üretebilir.

3. Annotation Bütçesini Baştan Dahil Et

Segmentation kalitesi çoğu zaman veri maliyetiyle sınırlıdır.

4. Deployment Koşullarını Görev Seçimiyle Birlikte Düşün

Düşük gecikme gereken sistemlerde classification veya hafif detection daha rasyonel olabilir.

5. Hibrit Görev Tasarımını Seçenek Olarak Tut

Bazen tek görev değil, görev sıralaması en iyi çözümdür.

30-60-90 Günlük Uygulama Çerçevesi

İlk 30 Gün: Problem Çıktısını Netleştir

  • Use-case’in etiket, konum veya piksel düzeyinde hangi çıktıya ihtiyaç duyduğunu belirle
  • Hata maliyetini classification, detection ve segmentation açısından ayrı değerlendir
  • Mevcut veri ve etiketleme bütçesini çıkar

31-60 Gün: Görev Bazlı Pilot Kur

  • Gerekliyse aynı veri üzerinde classification ve detection prototiplerini karşılaştır
  • Segmentation ihtiyacı varsa önce annotation maliyetini ve değerini test et
  • Görev tipine özel metrik setini tanımla

61-90 Gün: Production Uygunluğunu Doğrula

  • Seçilen görev ailesini gerçek latency ve operasyon akışında test et
  • İnsan onayı, hata düzeltme ve monitoring ihtiyacını tanımla
  • İlk kurumsal vision task selection standardını yayınla

Sonuç: Doğru Görü Görevi Seçimi, Model Seçiminden Önce Gelen Stratejik Karardır

Image classification, object detection ve segmentation; bilgisayarlı görünün üç temel ama farklı görev ailesidir. Classification görüntüye karar verir, detection nesneleri bulur, segmentation ise görsel alanı ayrıştırır. Bu fark yalnızca teknik çıktı farkı değildir; veri toplama maliyetini, model karmaşıklığını, değerlendirme mantığını ve iş etkisini belirleyen temel tasarım farkıdır.

Bu nedenle güçlü görü sistemleri, en gelişmiş modeli rastgele kullanan sistemler değil; problemi doğru görev ailesine dönüştürebilen sistemlerdir. Uzun vadede başarılı ekipler, segmentation kullanabildikleri için değil; segmentation’ın gerçekten gerekli olduğu yeri classification ve detection’dan ayırabildikleri için daha güçlü olacaktır.

Sık Sorulan Sorular

Segmentation her zaman detection’dan daha mı iyidir?

Hayır. Daha detaylıdır; ama her problem bu detaya ihtiyaç duymaz. Gereksiz kullanıldığında maliyet ve karmaşıklık artırır.

Detection ile classification aynı veri üzerinde kullanılabilir mi?

Evet. Hatta birçok sistem önce classification ile filtreleme yapıp sonra detection kullanabilir.

Bir görüntüde tek nesne varsa detection gerekir mi?

Bu, nesnenin konum bilgisinin iş açısından gerekli olup olmamasına bağlıdır. Sadece sınıf bilgisi yeterliyse classification daha uygundur.

Segmentation annotation neden bu kadar pahalıdır?

Çünkü her nesnenin veya sınıfın piksel düzeyinde sınırları çizilir. Bu, bounding box çizmekten çok daha fazla emek gerektirir.

En güvenli başlangıç yaklaşımı nedir?

Genellikle önce problem için minimum yeterli çıktı düzeyini belirlemek, sonra classification, detection ve gerekiyorsa segmentation arasında en düşük gereksiz karmaşıklığa sahip görevi seçmektir.

Danismanlik Baglantilari

Bu yaziya en yakin consulting sayfalari

Bu blog iceriginden bir sonraki adima gecmek istersen, en ilgili solution, role ve industry landing'lerini burada gorebilirsin.

Yorumlar

Yorumlar