Derin Öğrenme Tabanlı Nicemlenmiş Nesne Tespit Mimarilerinde Sınıf Sayısının Hız ve Başarıma Etkisi


Oğuz C., Üstün E., Urhan O.

International Marmara Sciences Congress (IMASCON 2023 – Autumn), Kocaeli, Türkiye, 15 - 16 Aralık 2023, ss.285-292

  • Yayın Türü: Bildiri / Tam Metin Bildiri
  • Basıldığı Şehir: Kocaeli
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.285-292
  • Kocaeli Üniversitesi Adresli: Evet

Özet

Bilgisayarla görü sistemlerinde derin öğrenme tekniklerinin kullanımı günümüzde yaygın bir pratik haline gelmiştir. Bunun temel nedenleri arasında derin öğrenme temelli yaklaşımların geleneksel makine öğrenme yaklaşımlarına göre sağladığı performans artışı önemli bir yer tutmaktadır. Öte yandan derin öğrenme temelli yaklaşımlar önemli miktarda işlem gücü gereksinimini de beraberinde getirmektedir. Dolayısıyla bu yöntemlerin düşük maliyetli gömülü sistemlerde belirli bir performansta çalıştırılması önemli bir araştırma alanıdır. Bu çalışmada, düşük maliyetli gömülü sistemlerde gerçek zamanlı çalışabilen, kameradan alınan görüntü üzerinde etkili bir nesne tespiti gerçekleştirebilen Derin Yapay Sinir Ağları mimarisi üzerindeki hız ve performans kriterlerini etkileyen bazı detaylar incelenmiştir. Bu bağlamda, klasik bir CNN (Evrişimli Sinir Ağları) temelli sınıflandırıcıya SSD (Single Shot Multibox Detector) katmanlarının entegre edilmesi ile nesne tespiti mimarisi oluşturulmuştur. Sınıflandırıcı olarak MobileNetV2 tercih edilmiş ve modelin düşük güç tüketimine sahip bir TPU üzerinde etkin bir şekilde çalışabilmesi için model nicemleme teknikleri uygulanmıştır. Çalışmada gerçekleştirilen deneysel çalışma çerçevesinde model sınıflandırıcısına birden fazla sınıf (nesne) tanımlanması durumunda, sınıf sayısının artışının gerçek zamanlı performans üzerindeki etkileri ele alınmıştır. Sınıf sayısındaki artışın, modelin hızını ve performansını nasıl etkilediği incelenmiştir.

Nowadays, the utilization of deep learning techniques in computer vision systems has become a prevalent practice. Among its fundamental reasons, the performance enhancement offered by deep learning-based approaches compared to traditional machine learning approaches holds a significant place. However, it is noteworthy that deep learning approaches also entail a substantial requirement for computational power. Consequently, the effective execution of these methods in low-cost embedded systems constitutes an interesting area of research. Within this study, an examination has been conducted on the intricacies influencing the speed and performance criteria of a Deep Artificial Neural Network architecture capable of real-time operation on low-cost embedded systems, conducting effective object detection on images captured by a camera. In this context, an object detection architecture was formulated by integrating SSD (Single Shot Multibox Detector) layers into a classical CNN (Convolutional Neural Network) based classifier. MobileNetV2 was chosen as the classifier, and model quantization techniques were applied to enable efficient operation on a TPU with low power consumption. In the experimental framework of the study, the impact of an increase in the number of classes (objects) defined in the model classifier on real-time performance was investigated. The study delved into how the augmentation of the number of classes affected the speed and performance of the model.