İlhan Omurca S. (Yürütücü)
TÜBİTAK Projesi, 2015 - 2018
Günlük
hayatımızda önemli bir yere sahip olan internet; depolanan verilerin e-ticaret
siteleri, sosyal medya siteleri, bloglar, sözlükler, haber portalları gibi
milyonlarca kullanıcısı olan yeni kaynaklar ile sürekli ve önlenemez artışı
sonucunda veri analizi için vazgeçilmez bir ortam haline gelmiştir.
İnternetteki sınırsız bilgi-yorum akışı çok farklı alanlardaki kullanıcı
yorumlarının analiz edilebilmesine olanak vermiştir. Günümüzde firmalar kendi
markalarının ürünlerini değerlendirirken ya da geliştirirken müşterilerden
alınan geri bildirimlerden faydalanma yolunu seçmektedirler. Bu geri bildirimler, firmaların ürettikleri
ürünlerin niteliklerinin ve firmaların rekabetçi güçlerinin artmasına yardımcı
olan en önemli unsurlar olarak kabul görmektedir. Artık müşteriler ve firmalar
kullanılan ürün ile ilgili çok sayıda kullanıcı yorumuna internet üzerinden
kolayca erişebilmektedir. Bu kadar büyük bir doküman kümesi içinden herhangi
bir ürün hakkında yapılan olumlu olumsuz yorumların çıkarılması; bu yorumların
ürüne ait hangi özellikler için yapıldığının keşfi el ile
gerçekleştirilemeyecek bir işlemdir. Özetle ürünlerin zayıf özelliklerinin
kullanıcı yorumlarından otomatik olarak keşfedilmesi önemli bir hale
gelmektedir.
Sentiment
analizi (duygu analizi) alanında yapılan çalışmaların büyük çoğunluğu metnin
anlamının olumlu veya olumsuz olduğu üzerine odaklamıştır. Günümüzde ise
kullanıcı yorumlarının daha derinlemesine analizi için özellik tabanlı
sentiment analizi (aspect based sentiment analysis) öne çıkan çalışma alanı
haline gelmiştir. Ürüne ait özelliklerin otomatik olarak belirlenmesi ürün
hakkında yapılan yorumların yöneliminin (olumlu/olumsuz) belirlenmesi için çok
önemli bir adımdır. Örneğin bir restoran hakkında yapılan yorumun
olumlu/olumsuz olmasından çok bu yorumun restorana ait yemek, servis vb. gibi
özellikler için nasıl anlam taşıdığı kullanıcı yorumunun daha doğru analiz
edilebilmesi için önemli bir saptamadır. Özellikler, metinlerde duyguların
ifade edildiği başlıklardır.
Bu projede
internetteki Türkçe kullanıcı yorumları üzerinde olumlu/olumsuz sınıflama
yapabilen özgün bir özellik tabanlı sentiment analizi yöntemi geliştirilmesi hedeflenmektedir.
Literatürdeki çalışmalarda, Türkçe metinlerin özellik tabanlı sentiment
analizine özgü bir çalışmaya ve yazılıma rastlanmamış olması bu alanda
yapılacak olan projenin değerini artıracaktır. Geliştirilen sistem ile bir ürün
hakkında genel kullanıcı fikrinin olumlu ya da olumsuz olduğu keşfedilebilecek
aynı zamanda ürünün güçlü ve zayıf özellikleri belirlenebilecektir. Sistemin
başarısı restoranlar için yapılan kullanıcı yorumları üzerinde test
edilecektir.
Proje dört
temel aşamadan oluşmaktadır. Birinci aşamada, duygusu açık şekilde bilinen
Türkçe sentiment (duygu) çekirdekleri ile oluşturulmuş sentiment sözlüğü bir
algoritma yardımı ile iteratif olarak genişletilecektir. Ürün özellikleri
belirgin (explicit) ve örtülü (implicit) özellikler olarak iki ayrı şekilde
incelenecektir. Projenin ikinci aşamasında tekli veya öbek şeklindeki
isimlerden belirgin özellik olarak kullanılanların saptanmasında
genelleştirilmiş bir yöntem uygulanacaktır. Üçüncü aşamada seçilen alana özgü
(restoran temel alanı için) sentiment puanlama yapan sentiment analizi sistemi
işletilecektir. En son aşamadaki analizde ise bulunması belirgin özelliklere
göre daha zor olan örtülü özelliklerin literatürdeki yöntemlerden farklı olarak
bizim önerdiğimiz bir yöntem ile çıkarılması gerçekleştirilecektir. Sentiment
içeren her cümlede her sentimentin hedef aldığı bir özellik vardır. Eğer
cümlede hedef özellik açık değilse gizlidir (örtülü özellik) ve cümledeki
sentiment hem örtülü özellik hem de sentiment görevini üstlenmektedir. Otomatik
olarak keşfedilen örtülü özellikler sentiment puanlama için kurulan doküman
matrisinin güncellenmesinde kullanılacak ve ürünün farklı özelliklerinin ne
kadar zayıf/güçlü olduğu belirlenmiş olacaktır. Sentiment sınıflama işlemine
ait raporlama yorumların olumlu/olumsuz sınıfları üzerinden yapılabilecek ya da
özellik düzeyinde gerçekleştirilecektir.
Model daha önceden
olumlu/olumsuz şekilde etiketlenmiş hiçbir dokümana ihtiyaç duymayan ve film
veya elektronik ürün yorumları gibi farklı alanlara kolayca adapte edilebilir
yapıda tasarlanacaktır. Kullanım oranını artırmak ve kullanım kolaylığı
yaratmak amacıyla sistem, mobil cihazlardan erişilebilecek şekilde
tasarlanacaktır. Geliştirilecek yazılımda Mobil uygulama, yoğun hesaplama
gerektiren işlemleri gerçekleştirmeden, uygulama sunucusuna değerlendirmek
istediği ürün bilgisini gönderecektir. Kullanıcı yorumlarının önceden
belirlenen bir alanda (“www.yemeksepeti.com”) elde edilmesi ve sentiment
analizi işlemleri sunucu tarafında gerçekleştirilip sonuç bilgisi mobil cihaza
iletilecektir. Bu şekilde kullanıcılar ilgilendikleri ürünün zayıf veya güçlü
özelliklerini kolay ve etkili şekilde görüntüleyebileceklerdir.