KLASIFIKASI ANALISIS SENTIMEN MENGENAI HOTEL DI YOGYAKARTA
Abstract
Abstrak. Yogyakarta adalah destinasi wisata yang sangat menarik, sering disebut dengan kota Yogya. Kota ini selalu ramai dikunjungi para wisatawan dari luar kota, terutama pada masa-masa liburan. Jumlah wisatawan baik dalam dan luar negeri pada tahun 2016 sekitar 4,5 juta orang meningkat sekitar 10% dari jumlah wisatawan pada tahun 2015. Kenaikan jumlah wisatawan diiringi dengan meningkatnya jumlah hotel bintang maupun non bintang. Tempat yang menarik dari Yogya, salah satunya adalah daerah Malioboro. Perkembangan hotel disekitar Malioboro dan okupansi hotel tentu meningkat. Banyak website penyedia informasi dan pemesanan hotel seperti www. Traveloka.com yang juga menampung opini dari wisatawan. Pengolahan data opini perlu untuk mengetahui kualitas layanan dari hotel tersebut. Di sisi lain jumlah opini semakin bertambah banyak untuk mengetahui apakah opini positif, negatif atau netral. Sehingga pengolahan data secara otomatis menjadi sangat penting. Penelitian ini melakukan analisa sentiment terhadap opini para wisatawan mengenai kualitas layanan hotel di malioboro Yogya secara otomatis. Analisa sentiment dengan melakukan klasifikasi opini untuk menentukan polaritas opini yaitu positif, negatif atau netral dengan beberapa metode klasifikasi. Pada ekstraksi fitur dilakukan dengan beberapa model dengan mengkombinasikan berbagai parameter yaitu tf, tf-idf dan penggunaan stopword atau tidak pada saat preprocessing. Ekstraksi fitur dengan beberapa model untuk mengetahui model yang optimal dengan data set uji coba. Metode klasifikasi yang digunakan adalah Naïve Bayes, KNN, J48, Random Forest dan SVM. Dari hasil uji coba, fitur yang paling optimal adalah model 1 karena menghasilkan kinerja klasifikasi lebih bagus dibandingkan dengan model fitur lain, selanjutnya diikuti oleh model 2, model 5, model 3, model 4 dan model 6. Fitur dengan model 1 adalah fitur dengan pembobotan kata TF dan pada saat preprocessing tidak menghilangkan stopword. Jumlah data set pada uji coba yang digunakan tidak terlalu besar yaitu 345 data, sehingga dimensi data tidak terlalu besar. Proses klasifikasi untuk data set ini membutuhkan fitur lengkap yaitu model 1 dan model 2. Fitur lengkap, tanpa menghilangkan stopword, karena ternyata stopword juga sebagai penentu untuk klasifikasi polaritas opini. Dari hasil uji coba, kinerja metode klasifikasi terhadap model ekstraksi fitur berdasarkan nilai recall. Nilai recall menunjukkan berapa persen data terklasifikasikan dengan benar oleh sistem. Dari hasil analisa menunjukkan bahwa metode SVM unggul dibandingkan dengan metode lainnya, selanjutnya diikuti oleh model Naïve Bayes, KNN, Random Forest dan J48. Metode SVM unggul untuk semua model kecuali model 6.
Kata Kunci: klasifikasi, fitur, pembobotan kata, Yogyakarta
Refbacks
- There are currently no refbacks.