Tez Türü: Doktora
Tezin Yürütüldüğü Kurum: Kocaeli Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği, Türkiye
Tez Danışmanı: Sevinç Ilhan Omurca
Tezin Onay Tarihi: 2018
Tezin Dili: Türkçe
Desteklendiği Program: Bu tezi destekleyen bir program bulunmamaktadır
Özet:
Sınıflandırıcı toplulukların arkasındaki temel fikir, genel doğruluğu geliştirmeyi bekleyerek birden fazla sınıflandırıcı kullanmaktır. Sınıflandırıcı toplulukların, temel öğrenicilerin bireysel başarısı ve çeşitlilik olmak üzere iki faktöre bağlı olarak genel sınıflandırma performansını artırdığı bilinmektedir. Genişletilmiş uzay ormanları da sınıflandırma problemlerinde iyileştirmeler sağlamak için kullanılan ortak bir konudur. Daha zengin özellik uzayı sağlarlar ve orijinal özellik uzay tabanlı ormanlardan daha iyi performans sunarlar. Güncel literatür çalışmaların çoğu, genişletilmiş uzay orman yaklaşımı için giriş vektörleri olarak orijinal özelliklerin yanı sıra bunların çeşitli kombinasyonlarını da kullanmaktadır. Bu amaçla tez kapsamında, genişletilmiş uzay ormanlarının homojen ve heterojen sınıflayıcı topluluklarla kombinasyonlarının sınıflandırma başarısını, bilgi kazanımı, ki-kare, karınca kolonisi optimizasyonu, derin öğrenmeye dayalı kelime göbekleri gibi özellik geliştirme yöntemleri ile incelenilmesine odaklanılmıştır. Topluluk sisteminin temel öğrenicileri, saf Bayes' in iki varyantı, destek vektör makineleri ve karar ağaçları gibi sınıflandırma algoritmalarına dayanmaktadır. Torbalama, artırma, rastgele alt uzaylar, rastgele ormanlar, çoğunluk oyu ve istifleme, veri çeşitliliğini sağlamak ve sistemin son kararını birleştirmek için bir araya getirme stratejileridir. Yaygın olarak kullanılan biyomedikal veri kümeleri, Türkçe ve İngilizce metinleri içeren veri kümeleri önerilen çalışmanın ilerlemesine katkıda bulunmak için geniş bir yelpazede gerçekleştirilen karşılaştırmalı deneylerin yürütülmesinde kullanılmıştır. Son olarak, önerilen yöntem ile genişletilmiş uzay ormanı yaklaşımı, güncel literatür çalışmaların orijinal versiyonuna ve çeşitli genişletilmiş versiyonlarına kıyasla performans ölçeklerinde dikkate değer deneysel sonuçları ortaya çıkarmaktadır.