PENGARUH EKSTRAKSI FITUR DAN STEMMER TERHADAP ALGORITMA SUPPORT VECTOR MACHINE PADA ANALISIS SENTIMEN BERBASIS LEKSIKON

Huda, Luthfi Nurul (2024) PENGARUH EKSTRAKSI FITUR DAN STEMMER TERHADAP ALGORITMA SUPPORT VECTOR MACHINE PADA ANALISIS SENTIMEN BERBASIS LEKSIKON. S2 - Magister thesis, Universitas AMIKOM Yogyakarta.

[img] Text (THESIS)
21.55.2157 Luthfi Nurul Huda.pdf

Download (4MB)

Abstract

Analisis sentimen adalah bidang yang memiliki potensi besar dalam penelitian dan aplikasi praktis. Berbagai tantangan dihadapi dalam analisis sentimen, termasuk bagaimana menentukan kombinasi preprocessing yang optimal, menentukan algoritma klasifikasi terbaik, bagaimana meningkatkan akurasi algoritma yang digunakan, dan bahkan bagaimana data dibersihkan. Penelitian ini sendiri bertujuan untuk mencari kombinasi terbaik dari ekstraksi fitur stemmer dalam analisis sentimen berbasis leksikon terhadap algoritma SVM. Terdapat 6 skenario yang digunakan dalam penelitian ini antara kombinasi stemmer dan ekstraksi fitur. Stemmer yang digunakan dalam penelitian ini adalah Porter stemmer, Snowball Stemmer dan Wordnet Lemmatizer. N-Grams dan BoW dipilih sebagai ekstraksi fitur yang akan diuji. Berdasarkan tujuan dari penelitian ini, SentiWordNet dipilih sebagai kamus leksikon dan SVM sebagai algoritma klasifikasi yang dipilih. Untuk memperkuat hasil penelitian, semua skenario diuji pada 3 dataset yang berbeda yaitu dataset IMDb, dataset Twitter US Airline Sentiment dan dataset Stanford140. Metode yang diusulkan dalam penelitian ini dinilai efektif dalam mengklasifikasikan teks sentimen. Hal ini dibuktikan dengan akurasi pada dataset IMDb dengan perpaduan Lemmatizer dan N-Grams, Twitter US Airline Sentiment, dan Sentiment140 dengan perpaduan Porter dan N-Grams. Masing-masing mencatat akurasi sebesar 96.08%, 88.46% dan 91.71%. Dan Porter stemmer dan N-Gram merupakan kombinasi stemmer dan feature extraction yang paling efektif meningkatkan performa SVM, dengan rata-rata akurasi 91.35% pada ketiga dataset yang digunakan.

Item Type: Thesis (S2 - Magister)
Contributor:
Pembimbing
Sunyoto, Andi
Kusnawi, Kusnawi
Uncontrolled Keywords: Analisis Sentimen, Stemmer, Feature Extraction, Lexicon, SVM
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus
Divisions: Pascasarjana Magister Informatika > PJJ Magister Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 24 Mar 2025 02:22
Last Modified: 24 Mar 2025 02:22
URI: http://eprints.amikom.ac.id/id/eprint/29023

Actions (login required)

View Item View Item