Endena, Ghaluh Bhelby (2024) PENERAPAN ALGORITMA K-NEAREST NEIGHBORS (KNN) DALAM ANALISIS SENTIMEN FILM 'GADIS KRETEK' DI TWITTER. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (798kB) |
|
Text (BAB I)
BAB I.pdf Download (216kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (745kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (766kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (774kB) |
|
Text (BAB V)
BAB V.pdf Download (97kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (83kB) |
|
Archive (SOURCE CODE)
Sourcecode - 20.11.3524.zip Restricted to Repository staff only Download (29kB) |
|
Text (PUBLIKASI)
Publikasi.pdf Restricted to Repository staff only Download (461kB) |
Abstract
Penelitian ini bertujuan untuk menganalisis sentimen terhadap film 'Gadis Kretek' di Twitter dengan menggunakan algoritma K-Nearest Neighbors (KNN). Data dikumpulkan dari Twitter yang mencakup 13.180 tweet, dengan proses preprocessing untuk memastikan data bersih dan konsisten. Komentar dalam bahasa Indonesia dipisahkan menjadi 2.227 komentar negatif dan 2.105 komentar positif. Model KNN diterapkan pada data yang telah diproses menggunakan TF-IDF untuk transformasi teks menjadi fitur numerik. Evaluasi model dilakukan dengan crossvalidation untuk menentukan nilai K yang optimal, yang ditemukan sebesar 48 dengan akurasi 69,60%. Pencarian parameter terbaik menggunakan RandomizedSearchCV menunjukkan bahwa parameter optimal adalah {'knn__weights': 'uniform', 'knn__metric': 'euclidean'}, yang menghasilkan akurasi 70,30% pada data uji. Eksperimen dengan berbagai ukuran data uji (30%, 20%, dan 10%) menunjukkan bahwa ukuran data uji 30% memberikan akurasi 71% dengan recall tinggi untuk komentar negatif (84%) dan recall lebih rendah untuk komentar positif (56%). Precision untuk komentar positif adalah 76% dan untuk komentar negatif 68%. Ukuran data uji 20% menghasilkan akurasi 70% dengan recall 55% untuk komentar positif dan 85% untuk komentar negatif, serta precision 77% untuk komentar positif dan 67% untuk komentar negatif. Ukuran data uji 10% menunjukkan akurasi meningkat menjadi 71,43%. Hasil penelitian ini menekankan pentingnya menemukan keseimbangan antara ukuran data pelatihan dan data uji untuk memperoleh model KNN yang stabil dan akurat.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | : Analisis Sentimen, K-Nearest Neighbors, TF-IDF, Cross Validation, Randomized Search CV | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data |
||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 18 Nov 2024 03:46 | ||
Last Modified: | 18 Nov 2024 03:46 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/28107 |
Actions (login required)
View Item |