Ichsan, Fadel Maulana (2020) PENGARUH PENGGUNAAN STEMMING DAN LEMMATIZATION TERHADAP AKURASI ANALISIS SENTIMEN. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (535kB) |
|
Text (BAB I)
BAB I.pdf Download (267kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (1MB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (243kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (1MB) |
|
Text (BAB V)
BAB V.pdf Download (33kB) |
|
Text (DAFTAR PUSTAKA - LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf Restricted to Registered users only Download (277kB) |
|
Other (SOURCE CODE)
Source Code-16.11.0587-Fadel Maulana Ichsan - Fadel Maulana Ichsan.rar Restricted to Repository staff only Download (5MB) |
|
Text (PUBLIKASI)
Publikasi - 16.11.0587 - Fadel Maulana Ichsan - Fadel Maulana Ichsan.pdf Restricted to Repository staff only Download (468kB) |
Abstract
Analisis sentimen adalah studi komputasional dari opini-opini orang dengan menggunakan ilmu text mining. Analisis sentimen akan mengelompokkan teks yang ada dalam kalimat atau dokumen untuk mengetahui pendapat yang dikemukakan dalam kalimat atau dokumen tersebut, bisa berupa sentimen positif, maupun negatif. Sebelum dapat mengelompokkan sentimen menjadi positif maupun negatif, data teks akan melalui tahap preprocessing terlebih dahulu. Preprocessing berguna untuk membersihkan data dari noise, serta mempermudah classifier untuk melakukan klasifikasi. Salah satu tahapan preprocessing data adalah stemming dan lemmatization. Stemming dan lemmatization adalah salah satu tahap preprocessing untuk mengubah kata berimbuhan menjadi kata dasar. Walaupun memiliki fungsi yang sama namun terdapat perbedaan dalam implementasi stemming dan lemmatization. Pada stemming pengubahan hanya dilakukan dengan memotong/ menghapus imbuhan kata. Sedangkan lemmatization memiliki alur yang lebih kompleks dengan melibatkan kamus bahasa untuk mencari kata dasar (root). Pada penelitian ini dilakukan komparasi antara stemming dengan lemmatization untuk kasus analisis sentimen. Dataset akan diklasifikasi dengan algoritma support vector machine, kemudian dievaluasi dengan confusion matrix dan divalidasi menggunakan metode k-fold cross validation untuk melihat akurasi dari masing-masing preprocessing. Dan hasil akurasi keduanya akan dikomparasi menggunakan uji statistik untuk melihat apakah perbedaan diantara keduanya signifikan atau tidak. Setelah dilakukan evaluasi dengan confusion matrix, preprocessing dengan stemming menghasilkan akurasi sebesar 85% sedangkan lemmatization menghasilkan akurasi 84%. Namun setelah dilakukan uji signifikansi, ternyata perbedaan dari keduanya tidak signifikan.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | analisis sentimen, stemming, lemmatization, uji signifikan | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum | ||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 27 Jun 2022 03:22 | ||
Last Modified: | 21 Aug 2023 02:51 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/2803 |
Actions (login required)
View Item |