KOMBINASI ALGORITMA SMOTE DENGAN ALGORITMA KLUSTERING UNTUK MENANGANI KETIDAKSEIMBANGAN KELAS PADA LEVEL DATA AlGORITMA KLASIFIKASI

Gumelar, Gagah (2023) KOMBINASI ALGORITMA SMOTE DENGAN ALGORITMA KLUSTERING UNTUK MENANGANI KETIDAKSEIMBANGAN KELAS PADA LEVEL DATA AlGORITMA KLASIFIKASI. S2 - Magister thesis, Universitas AMIKOM Yogyakarta.

[img] Text (THESIS)
20.55.1354 Gagah Gumelar.pdf

Download (3MB)

Abstract

Imbalance data merupakan masalah yang harus diselesaikan pada klasifikasi data mining, karena dapat mengakibatkan menurunnya performa klasifikasi. salah satu cara untuk mengatasi masalah imbalance data adalah dengan metode sampling. metode sampling sendiri dibagi menjadi tiga yaitu under sampling, over sampling, dan hybrid. metode over sampling dipilih karena tidak menghilangkan informasi penting dari sebuah data. algoritma smote merupakan salah satu contoh dari algoritma oversampling. dalam perkembangannya algoritma smote memiliki kelemahan yaitu data sintesis yang dihasilkan mengalami overgeneralize dan noise sehingga ditemukan algoritma kmeans smote pada penelitian ini membandingkan antara dataset tanpa resampling dengan yang telah dilakukan resampling. Pengukuran hasil penelitian menggunakan algoritma klasifikasi yaitu logistic regression, decision tree, naïve bayes dan svm confusion matrix dan gmean sebagai penguji performa klasifikasi. Hasil dari penelitian penerapan metode oversampling pada dataset dengan nilai IR rendah sampai tinggi. Nilai performa dari skenario yang telah diimplementasikan didapat bahwa nilai berpengaruh pada algorima sampling, algoritma klasifikasi dan nilai IR dari dataset. Implementasi dari model dynamic kmeans smote didapat bahwa implementasi model pada kelompok IR rendah dataset dengan IR 1,86 berpengaruh pada algoritma naïve bayes dimana memberikan perbaikan terhadap nilai akurasi dan nilai gmean memperbaiki nilai akurasi dari implementasi tanpa sampling yang sebelumnya 95,4 % menjadi 97,7 % dan nilai gmean dari 0,943 menjadi 0,971. Kemudian, implementasi model dynamic kmeans smote pada kelompok IR sedang dengan IR 10 berpengaruh memperbaiki nilai gmean pada algoritma SVM dari implementasi tanpa sampling dari 0,816 menjadi 0,987. Pada implementasi model dynamic kmeans smote pada kelompok IR tinggi meningkatkan nilai gmean pada algoritma klasifikasi logistic regression, decision tree, naïve bayes, KNN, dan SVM.

Item Type: Thesis (S2 - Magister)
Contributor:
Pembimbing
Kusrini, Kusrini
Al Fatta, Hanif
Uncontrolled Keywords: Imbalance Dataset, SMOTE, Kmeans SMOTE, Dynamic Kmeans SMOTE
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Pascasarjana Magister Informatika > PJJ Magister Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 21 Mar 2025 06:14
Last Modified: 21 Mar 2025 06:14
URI: http://eprints.amikom.ac.id/id/eprint/28980

Actions (login required)

View Item View Item