PERBANDINGAN ALGORITMA CBOW DAN SKIP-GRAM PADA METODE WORD EMBEDDING FASTTEXT UNTUK SENTIMEN ANALISIS

Susilo, Tri (2022) PERBANDINGAN ALGORITMA CBOW DAN SKIP-GRAM PADA METODE WORD EMBEDDING FASTTEXT UNTUK SENTIMEN ANALISIS. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (517kB)
[img] Text (BAB I)
BAB I.pdf

Download (173kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (430kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (393kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (239kB)
[img] Text (BAB V)
BAB V.pdf

Download (41kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (113kB)
[img] Other (SOURCE CODE)
Source Code 18.11.1823 Tri Susilo.rar
Restricted to Repository staff only

Download (2MB)
[img] Text (PUBLIKASI)
Publikasi 18.11.1823 Tri Susilo.pdf
Restricted to Repository staff only

Download (382kB)

Abstract

Sentimen analisis merupakan salah satu bidang dari NLP yang digunakan untuk klasifikasi data tekstual. Pada proses analisis sentimen terdapat suatu proses untuk mengubah teks menjadi vektor, metode yang paling sering digunakan untuk mengubah teks menjadi vektor adalah Bag of Words. Metode BoW ini sendiri memiliki kelemahan seperti hilangnya konteks dari kalimat, urutan kata, dan hubungan semantik antar kata dan membutuhkan ukuran penyimpanan yang besar. Fasttext hadir untuk mengatasi masalah tersebut dengan konsep word to vector, dan mempunyai kemampuan untuk menangani kata-kata yang belum pernah muncul sebelumnya. Penelitian ini menggunakan metode CBOW dan Skip-gram pada fasttext untuk membentuk word vector di corpus. Beberapa ukuran dimensi dari word vector yaitu dimensi 50,100,150,200, dan 300 digunakan untuk mengetahui pengaruhnya terhadap akurasi yang dihasilkan. Akurasi terbaik diperoleh pada ukuran dimensi word vector 300 dengan akurasi 82,5% dan akurasi terendah sebesar 74,8% pada ukuran dimensi word vektor 50. Untuk ukuran dimensi word vector 50,150,200 dan 300 metode Skipgram lebih unggul dibandingkan metode CBOW. Sedangkan metode CBOW unggul di ukuran dimensi word Vector 100 dengan hasil akurasi 77,5% dan 74,9% untuk metode Skip-gram.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Setyanto, Arief
Uncontrolled Keywords: Word Embedding, Fasttext, LSTM, CBOW, Skip-gram, Sentimen Analisis, Teks Indonesia
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 30 Dec 2022 03:52
Last Modified: 29 Jul 2023 03:52
URI: http://eprints.amikom.ac.id/id/eprint/13855

Actions (login required)

View Item View Item