PERBANDINGAN KINERJA LSTM PADA UNIT 8,16, DAN 32 UNIT DENGAN WORD EMBEDDING TF-IDF, WORD2VEC, DAN FASTTEXT DALAM KASUS CYBERBULLYING DI MEDIA SOCIAL INDONESIA

Barwaqah, Rico Basyar (2024) PERBANDINGAN KINERJA LSTM PADA UNIT 8,16, DAN 32 UNIT DENGAN WORD EMBEDDING TF-IDF, WORD2VEC, DAN FASTTEXT DALAM KASUS CYBERBULLYING DI MEDIA SOCIAL INDONESIA. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (1MB)
[img] Text (BAB I)
BAB I.pdf

Download (244kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (556kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (423kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (436kB)
[img] Text (BAB V)
BAB V.pdf

Download (53kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (115kB)
[img] Archive (SOURCE CODE)
Sourcecode - 08.11.2556.zip
Restricted to Repository staff only

Download (19MB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (930kB)

Abstract

Media sosial sebagai platform yang dimana individu dapat berinteraksi satu sama lain. Media sosial tidak hanya memungkinkan pengguna untuk membagikan konten yang mereka buat tetapi juga dapat menghasilkan banyak opini dari penggunanya. Dari sekian banyak sudut pandang beberapa mengarah ke perbedaan pendapat dan, dari perbedaan pendapat tersebut sayangnya beberapa individu melakukan tindakan cyberbullying di platform ini. Tujuan dari penelitian ini adalah mengetahui perbedaan performa klasifier teks pada arsitektur LSTM dengan unit yang berbeda untuk klasifikasi pada cyberbully dengan menggunakan teknik word embedding TF-IDF, Word2vec, dan FastText. Dataset yang digunakan adalah kombinasi komentar Instagram yang diambil dari Kaggle dan tweet yang bersumber dari penelitian sebelumnya. Data yang diperoleh untuk penelitian ini terdiri dari total 1570 entri, data tersebut seimbang dengan 785 diberi label sebagai '0' untuk yang bukan cyberbullying dan 785 sebagai '1' untuk cyberbullying. Ukuran pengujian data adalah 30% dari total entri dan pengujian data yang dilakukan sebanding antara label ‘0’ dan ‘1’. Hasil tes menunjukkan dari teknik word embedding yang berbeda TF-IDF memiliki nilai accuracy yang paling tinggi, tetapi menurut gambar diagram garis jika unit LSTM ditambahkan maka TF-IDF memiliki potensi overfitting sedangkan Word2Vec memiliki kinerja yang optimal dan FastText tidak bisa melakukan pembelajaran pada kasus ini.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Setyanto, Arief
Uncontrolled Keywords: Cyberbullying, LSTM, TF-IDF, Word2vec, FastText, Klasifikasi Teks, Representasi Teks
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 17 Jul 2024 03:14
Last Modified: 15 Oct 2024 07:01
URI: http://eprints.amikom.ac.id/id/eprint/26298

Actions (login required)

View Item View Item