PENGARUH PENGGUNAAN STEMMING DAN LEMMATIZATION TERHADAP AKURASI ANALISIS SENTIMEN

Ichsan, Fadel Maulana (2020) PENGARUH PENGGUNAAN STEMMING DAN LEMMATIZATION TERHADAP AKURASI ANALISIS SENTIMEN. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (535kB)
[img] Text (BAB I)
BAB I.pdf

Download (267kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (243kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB V)
BAB V.pdf

Download (33kB)
[img] Text (DAFTAR PUSTAKA - LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf
Restricted to Registered users only

Download (277kB)
[img] Other (SOURCE CODE)
Source Code-16.11.0587-Fadel Maulana Ichsan - Fadel Maulana Ichsan.rar
Restricted to Repository staff only

Download (5MB)
[img] Text (PUBLIKASI)
Publikasi - 16.11.0587 - Fadel Maulana Ichsan - Fadel Maulana Ichsan.pdf
Restricted to Repository staff only

Download (468kB)

Abstract

Analisis sentimen adalah studi komputasional dari opini-opini orang dengan menggunakan ilmu text mining. Analisis sentimen akan mengelompokkan teks yang ada dalam kalimat atau dokumen untuk mengetahui pendapat yang dikemukakan dalam kalimat atau dokumen tersebut, bisa berupa sentimen positif, maupun negatif. Sebelum dapat mengelompokkan sentimen menjadi positif maupun negatif, data teks akan melalui tahap preprocessing terlebih dahulu. Preprocessing berguna untuk membersihkan data dari noise, serta mempermudah classifier untuk melakukan klasifikasi. Salah satu tahapan preprocessing data adalah stemming dan lemmatization. Stemming dan lemmatization adalah salah satu tahap preprocessing untuk mengubah kata berimbuhan menjadi kata dasar. Walaupun memiliki fungsi yang sama namun terdapat perbedaan dalam implementasi stemming dan lemmatization. Pada stemming pengubahan hanya dilakukan dengan memotong/ menghapus imbuhan kata. Sedangkan lemmatization memiliki alur yang lebih kompleks dengan melibatkan kamus bahasa untuk mencari kata dasar (root). Pada penelitian ini dilakukan komparasi antara stemming dengan lemmatization untuk kasus analisis sentimen. Dataset akan diklasifikasi dengan algoritma support vector machine, kemudian dievaluasi dengan confusion matrix dan divalidasi menggunakan metode k-fold cross validation untuk melihat akurasi dari masing-masing preprocessing. Dan hasil akurasi keduanya akan dikomparasi menggunakan uji statistik untuk melihat apakah perbedaan diantara keduanya signifikan atau tidak. Setelah dilakukan evaluasi dengan confusion matrix, preprocessing dengan stemming menghasilkan akurasi sebesar 85% sedangkan lemmatization menghasilkan akurasi 84%. Namun setelah dilakukan uji signifikansi, ternyata perbedaan dari keduanya tidak signifikan.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Hayaty, Mardhiya
Uncontrolled Keywords: analisis sentimen, stemming, lemmatization, uji signifikan
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 27 Jun 2022 03:22
Last Modified: 21 Aug 2023 02:51
URI: http://eprints.amikom.ac.id/id/eprint/2803

Actions (login required)

View Item View Item