PENERAPAN ALGORITMA K-NEAREST NEIGHBORS (KNN) DALAM ANALISIS SENTIMEN FILM 'GADIS KRETEK' DI TWITTER

Endena, Ghaluh Bhelby (2024) PENERAPAN ALGORITMA K-NEAREST NEIGHBORS (KNN) DALAM ANALISIS SENTIMEN FILM 'GADIS KRETEK' DI TWITTER. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

	Text (COVER-ABSTRAK) COVER.pdf Download (798kB)
	Text (BAB I) BAB I.pdf Download (216kB)
	Text (BAB II) BAB II.pdf Restricted to Registered users only Download (745kB)
	Text (BAB III) BAB III.pdf Restricted to Registered users only Download (766kB)
	Text (BAB IV) BAB IV.pdf Restricted to Registered users only Download (774kB)
	Text (BAB V) BAB V.pdf Download (97kB)
	Text (DAFTAR PUSTAKA) Daftar Pustaka.pdf Restricted to Registered users only Download (83kB)
	Archive (SOURCE CODE) Sourcecode - 20.11.3524.zip Restricted to Repository staff only Download (29kB)
	Text (PUBLIKASI) Publikasi.pdf Restricted to Repository staff only Download (461kB)

Abstract

Penelitian ini bertujuan untuk menganalisis sentimen terhadap film 'Gadis Kretek' di Twitter dengan menggunakan algoritma K-Nearest Neighbors (KNN). Data dikumpulkan dari Twitter yang mencakup 13.180 tweet, dengan proses preprocessing untuk memastikan data bersih dan konsisten. Komentar dalam bahasa Indonesia dipisahkan menjadi 2.227 komentar negatif dan 2.105 komentar positif. Model KNN diterapkan pada data yang telah diproses menggunakan TF-IDF untuk transformasi teks menjadi fitur numerik. Evaluasi model dilakukan dengan crossvalidation untuk menentukan nilai K yang optimal, yang ditemukan sebesar 48 dengan akurasi 69,60%. Pencarian parameter terbaik menggunakan RandomizedSearchCV menunjukkan bahwa parameter optimal adalah {'knn__weights': 'uniform', 'knn__metric': 'euclidean'}, yang menghasilkan akurasi 70,30% pada data uji. Eksperimen dengan berbagai ukuran data uji (30%, 20%, dan 10%) menunjukkan bahwa ukuran data uji 30% memberikan akurasi 71% dengan recall tinggi untuk komentar negatif (84%) dan recall lebih rendah untuk komentar positif (56%). Precision untuk komentar positif adalah 76% dan untuk komentar negatif 68%. Ukuran data uji 20% menghasilkan akurasi 70% dengan recall 55% untuk komentar positif dan 85% untuk komentar negatif, serta precision 77% untuk komentar positif dan 67% untuk komentar negatif. Ukuran data uji 10% menunjukkan akurasi meningkat menjadi 71,43%. Hasil penelitian ini menekankan pentingnya menemukan keseimbangan antara ukuran data pelatihan dan data uji untuk memperoleh model KNN yang stabil dan akurat.

Item Type:

Thesis (S1 - Sarjana)

Contributor:

Pembimbing
Al Fatta, Hanif

Uncontrolled Keywords:

: Analisis Sentimen, K-Nearest Neighbors, TF-IDF, Cross Validation, Randomized Search CV

Subjects:

000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data

Divisions:

Fakultas Ilmu Komputer > Informatika

Depositing User:

RC Universitas AMIKOM Yogyakarta

Date Deposited:

18 Nov 2024 03:46

Last Modified:

18 Nov 2024 03:46

URI:

http://eprints.amikom.ac.id/id/eprint/28107

Actions (login required)

View Item