Susilo, Tri (2022) PERBANDINGAN ALGORITMA CBOW DAN SKIP-GRAM PADA METODE WORD EMBEDDING FASTTEXT UNTUK SENTIMEN ANALISIS. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (517kB) |
|
Text (BAB I)
BAB I.pdf Download (173kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (430kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (393kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (239kB) |
|
Text (BAB V)
BAB V.pdf Download (41kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (113kB) |
|
Other (SOURCE CODE)
Source Code 18.11.1823 Tri Susilo.rar Restricted to Repository staff only Download (2MB) |
|
Text (PUBLIKASI)
Publikasi 18.11.1823 Tri Susilo.pdf Restricted to Repository staff only Download (382kB) |
Abstract
Sentimen analisis merupakan salah satu bidang dari NLP yang digunakan untuk klasifikasi data tekstual. Pada proses analisis sentimen terdapat suatu proses untuk mengubah teks menjadi vektor, metode yang paling sering digunakan untuk mengubah teks menjadi vektor adalah Bag of Words. Metode BoW ini sendiri memiliki kelemahan seperti hilangnya konteks dari kalimat, urutan kata, dan hubungan semantik antar kata dan membutuhkan ukuran penyimpanan yang besar. Fasttext hadir untuk mengatasi masalah tersebut dengan konsep word to vector, dan mempunyai kemampuan untuk menangani kata-kata yang belum pernah muncul sebelumnya. Penelitian ini menggunakan metode CBOW dan Skip-gram pada fasttext untuk membentuk word vector di corpus. Beberapa ukuran dimensi dari word vector yaitu dimensi 50,100,150,200, dan 300 digunakan untuk mengetahui pengaruhnya terhadap akurasi yang dihasilkan. Akurasi terbaik diperoleh pada ukuran dimensi word vector 300 dengan akurasi 82,5% dan akurasi terendah sebesar 74,8% pada ukuran dimensi word vektor 50. Untuk ukuran dimensi word vector 50,150,200 dan 300 metode Skipgram lebih unggul dibandingkan metode CBOW. Sedangkan metode CBOW unggul di ukuran dimensi word Vector 100 dengan hasil akurasi 77,5% dan 74,9% untuk metode Skip-gram.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Word Embedding, Fasttext, LSTM, CBOW, Skip-gram, Sentimen Analisis, Teks Indonesia | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer | ||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 30 Dec 2022 03:52 | ||
Last Modified: | 29 Jul 2023 03:52 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/13855 |
Actions (login required)
View Item |