Barwaqah, Rico Basyar (2024) PERBANDINGAN KINERJA LSTM PADA UNIT 8,16, DAN 32 UNIT DENGAN WORD EMBEDDING TF-IDF, WORD2VEC, DAN FASTTEXT DALAM KASUS CYBERBULLYING DI MEDIA SOCIAL INDONESIA. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (1MB) |
|
Text (BAB I)
BAB I.pdf Download (244kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (556kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (423kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (436kB) |
|
Text (BAB V)
BAB V.pdf Download (53kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (115kB) |
|
Archive (SOURCE CODE)
Sourcecode - 08.11.2556.zip Restricted to Repository staff only Download (19MB) |
|
Text (PUBLIKASI)
Publikasi.pdf Restricted to Repository staff only Download (930kB) |
Abstract
Media sosial sebagai platform yang dimana individu dapat berinteraksi satu sama lain. Media sosial tidak hanya memungkinkan pengguna untuk membagikan konten yang mereka buat tetapi juga dapat menghasilkan banyak opini dari penggunanya. Dari sekian banyak sudut pandang beberapa mengarah ke perbedaan pendapat dan, dari perbedaan pendapat tersebut sayangnya beberapa individu melakukan tindakan cyberbullying di platform ini. Tujuan dari penelitian ini adalah mengetahui perbedaan performa klasifier teks pada arsitektur LSTM dengan unit yang berbeda untuk klasifikasi pada cyberbully dengan menggunakan teknik word embedding TF-IDF, Word2vec, dan FastText. Dataset yang digunakan adalah kombinasi komentar Instagram yang diambil dari Kaggle dan tweet yang bersumber dari penelitian sebelumnya. Data yang diperoleh untuk penelitian ini terdiri dari total 1570 entri, data tersebut seimbang dengan 785 diberi label sebagai '0' untuk yang bukan cyberbullying dan 785 sebagai '1' untuk cyberbullying. Ukuran pengujian data adalah 30% dari total entri dan pengujian data yang dilakukan sebanding antara label ‘0’ dan ‘1’. Hasil tes menunjukkan dari teknik word embedding yang berbeda TF-IDF memiliki nilai accuracy yang paling tinggi, tetapi menurut gambar diagram garis jika unit LSTM ditambahkan maka TF-IDF memiliki potensi overfitting sedangkan Word2Vec memiliki kinerja yang optimal dan FastText tidak bisa melakukan pembelajaran pada kasus ini.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Cyberbullying, LSTM, TF-IDF, Word2vec, FastText, Klasifikasi Teks, Representasi Teks | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data |
||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 17 Jul 2024 03:14 | ||
Last Modified: | 15 Oct 2024 07:01 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/26298 |
Actions (login required)
View Item |