PENERAPAN ALGORITMA K-NEAREST NEIGHBORS (KNN) DALAM ANALISIS SENTIMEN FILM 'GADIS KRETEK' DI TWITTER

Endena, Ghaluh Bhelby (2024) PENERAPAN ALGORITMA K-NEAREST NEIGHBORS (KNN) DALAM ANALISIS SENTIMEN FILM 'GADIS KRETEK' DI TWITTER. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (798kB)
[img] Text (BAB I)
BAB I.pdf

Download (216kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (745kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (766kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (774kB)
[img] Text (BAB V)
BAB V.pdf

Download (97kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (83kB)
[img] Archive (SOURCE CODE)
Sourcecode - 20.11.3524.zip
Restricted to Repository staff only

Download (29kB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (461kB)

Abstract

Penelitian ini bertujuan untuk menganalisis sentimen terhadap film 'Gadis Kretek' di Twitter dengan menggunakan algoritma K-Nearest Neighbors (KNN). Data dikumpulkan dari Twitter yang mencakup 13.180 tweet, dengan proses preprocessing untuk memastikan data bersih dan konsisten. Komentar dalam bahasa Indonesia dipisahkan menjadi 2.227 komentar negatif dan 2.105 komentar positif. Model KNN diterapkan pada data yang telah diproses menggunakan TF-IDF untuk transformasi teks menjadi fitur numerik. Evaluasi model dilakukan dengan crossvalidation untuk menentukan nilai K yang optimal, yang ditemukan sebesar 48 dengan akurasi 69,60%. Pencarian parameter terbaik menggunakan RandomizedSearchCV menunjukkan bahwa parameter optimal adalah {'knn__weights': 'uniform', 'knn__metric': 'euclidean'}, yang menghasilkan akurasi 70,30% pada data uji. Eksperimen dengan berbagai ukuran data uji (30%, 20%, dan 10%) menunjukkan bahwa ukuran data uji 30% memberikan akurasi 71% dengan recall tinggi untuk komentar negatif (84%) dan recall lebih rendah untuk komentar positif (56%). Precision untuk komentar positif adalah 76% dan untuk komentar negatif 68%. Ukuran data uji 20% menghasilkan akurasi 70% dengan recall 55% untuk komentar positif dan 85% untuk komentar negatif, serta precision 77% untuk komentar positif dan 67% untuk komentar negatif. Ukuran data uji 10% menunjukkan akurasi meningkat menjadi 71,43%. Hasil penelitian ini menekankan pentingnya menemukan keseimbangan antara ukuran data pelatihan dan data uji untuk memperoleh model KNN yang stabil dan akurat.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Al Fatta, Hanif
Uncontrolled Keywords: : Analisis Sentimen, K-Nearest Neighbors, TF-IDF, Cross Validation, Randomized Search CV
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 18 Nov 2024 03:46
Last Modified: 18 Nov 2024 03:46
URI: http://eprints.amikom.ac.id/id/eprint/28107

Actions (login required)

View Item View Item