Ürünlerin Zayıf Özelliklerinin Türkçe Kullanıcı Yorumlarından Özellik Tabanlı Sentiment Analizi ile Kesfedilmesi


Creative Commons License

İlhan Omurca S. (Yürütücü)

TÜBİTAK Projesi, 2015 - 2018

  • Proje Türü: TÜBİTAK Projesi
  • Başlama Tarihi: Eylül 2015
  • Bitiş Tarihi: Şubat 2018

Proje Özeti

Günlük hayatımızda önemli bir yere sahip olan internet; depolanan verilerin e-ticaret siteleri, sosyal medya siteleri, bloglar, sözlükler, haber portalları gibi milyonlarca kullanıcısı olan yeni kaynaklar ile sürekli ve önlenemez artışı sonucunda veri analizi için vazgeçilmez bir ortam haline gelmiştir. İnternetteki sınırsız bilgi-yorum akışı çok farklı alanlardaki kullanıcı yorumlarının analiz edilebilmesine olanak vermiştir. Günümüzde firmalar kendi markalarının ürünlerini değerlendirirken ya da geliştirirken müşterilerden alınan geri bildirimlerden faydalanma yolunu seçmektedirler. Bu geri bildirimler, firmaların ürettikleri ürünlerin niteliklerinin ve firmaların rekabetçi güçlerinin artmasına yardımcı olan en önemli unsurlar olarak kabul görmektedir. Artık müşteriler ve firmalar kullanılan ürün ile ilgili çok sayıda kullanıcı yorumuna internet üzerinden kolayca erişebilmektedir. Bu kadar büyük bir doküman kümesi içinden herhangi bir ürün hakkında yapılan olumlu olumsuz yorumların çıkarılması; bu yorumların ürüne ait hangi özellikler için yapıldığının keşfi el ile gerçekleştirilemeyecek bir işlemdir. Özetle ürünlerin zayıf özelliklerinin kullanıcı yorumlarından otomatik olarak keşfedilmesi önemli bir hale gelmektedir.

 

Sentiment analizi (duygu analizi) alanında yapılan çalışmaların büyük çoğunluğu metnin anlamının olumlu veya olumsuz olduğu üzerine odaklamıştır. Günümüzde ise kullanıcı yorumlarının daha derinlemesine analizi için özellik tabanlı sentiment analizi (aspect based sentiment analysis) öne çıkan çalışma alanı haline gelmiştir. Ürüne ait özelliklerin otomatik olarak belirlenmesi ürün hakkında yapılan yorumların yöneliminin (olumlu/olumsuz) belirlenmesi için çok önemli bir adımdır. Örneğin bir restoran hakkında yapılan yorumun olumlu/olumsuz olmasından çok bu yorumun restorana ait yemek, servis vb. gibi özellikler için nasıl anlam taşıdığı kullanıcı yorumunun daha doğru analiz edilebilmesi için önemli bir saptamadır. Özellikler, metinlerde duyguların ifade edildiği başlıklardır.

 

Bu projede internetteki Türkçe kullanıcı yorumları üzerinde olumlu/olumsuz sınıflama yapabilen özgün bir özellik tabanlı sentiment analizi yöntemi geliştirilmesi hedeflenmektedir. Literatürdeki çalışmalarda, Türkçe metinlerin özellik tabanlı sentiment analizine özgü bir çalışmaya ve yazılıma rastlanmamış olması bu alanda yapılacak olan projenin değerini artıracaktır. Geliştirilen sistem ile bir ürün hakkında genel kullanıcı fikrinin olumlu ya da olumsuz olduğu keşfedilebilecek aynı zamanda ürünün güçlü ve zayıf özellikleri belirlenebilecektir. Sistemin başarısı restoranlar için yapılan kullanıcı yorumları üzerinde test edilecektir.

 

Proje dört temel aşamadan oluşmaktadır. Birinci aşamada, duygusu açık şekilde bilinen Türkçe sentiment (duygu) çekirdekleri ile oluşturulmuş sentiment sözlüğü bir algoritma yardımı ile iteratif olarak genişletilecektir. Ürün özellikleri belirgin (explicit) ve örtülü (implicit) özellikler olarak iki ayrı şekilde incelenecektir. Projenin ikinci aşamasında tekli veya öbek şeklindeki isimlerden belirgin özellik olarak kullanılanların saptanmasında genelleştirilmiş bir yöntem uygulanacaktır. Üçüncü aşamada seçilen alana özgü (restoran temel alanı için) sentiment puanlama yapan sentiment analizi sistemi işletilecektir. En son aşamadaki analizde ise bulunması belirgin özelliklere göre daha zor olan örtülü özelliklerin literatürdeki yöntemlerden farklı olarak bizim önerdiğimiz bir yöntem ile çıkarılması gerçekleştirilecektir. Sentiment içeren her cümlede her sentimentin hedef aldığı bir özellik vardır. Eğer cümlede hedef özellik açık değilse gizlidir (örtülü özellik) ve cümledeki sentiment hem örtülü özellik hem de sentiment görevini üstlenmektedir. Otomatik olarak keşfedilen örtülü özellikler sentiment puanlama için kurulan doküman matrisinin güncellenmesinde kullanılacak ve ürünün farklı özelliklerinin ne kadar zayıf/güçlü olduğu belirlenmiş olacaktır. Sentiment sınıflama işlemine ait raporlama yorumların olumlu/olumsuz sınıfları üzerinden yapılabilecek ya da özellik düzeyinde gerçekleştirilecektir.

 

Model daha önceden olumlu/olumsuz şekilde etiketlenmiş hiçbir dokümana ihtiyaç duymayan ve film veya elektronik ürün yorumları gibi farklı alanlara kolayca adapte edilebilir yapıda tasarlanacaktır. Kullanım oranını artırmak ve kullanım kolaylığı yaratmak amacıyla sistem, mobil cihazlardan erişilebilecek şekilde tasarlanacaktır. Geliştirilecek yazılımda Mobil uygulama, yoğun hesaplama gerektiren işlemleri gerçekleştirmeden, uygulama sunucusuna değerlendirmek istediği ürün bilgisini gönderecektir. Kullanıcı yorumlarının önceden belirlenen bir alanda (“www.yemeksepeti.com”) elde edilmesi ve sentiment analizi işlemleri sunucu tarafında gerçekleştirilip sonuç bilgisi mobil cihaza iletilecektir. Bu şekilde kullanıcılar ilgilendikleri ürünün zayıf veya güçlü özelliklerini kolay ve etkili şekilde görüntüleyebileceklerdir.