Gumelar, Gagah (2020) IMPLEMENTASI ALGORITMA SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE (SMOTE) UNTUK MENANGANI KETIDAKSEIMBANGAN KELAS PADA DATASET KLASIFIKASI. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (529kB) |
|
Text (BAB I)
BAB I.pdf Download (274kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (736kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (434kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (3MB) |
|
Text (BAB V)
BAB V.pdf Download (159kB) |
|
Text (DAFTAR PUSTAKA - LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf Restricted to Registered users only Download (4MB) |
|
Archive (SOURCE CODE)
smote_manual - Gagah Gumelar.zip Restricted to Repository staff only Download (2kB) |
|
Text (PUBLIKASI)
Publikasi_16.11.0799 - Gagah Gumelar.pdf Restricted to Repository staff only Download (472kB) |
Abstract
Sebuah kelas dikatakan tidak seimbang apabila ada suatu kelas yang memiliki data yang lebih banyak dibandingkan dengan kelas lainnya. Kelompok kelas dengan jumlah data yang banyak disebut dengan kelas mayoritas, sedangkan kelompok kelas dengan jumlah yang sedikit disebut dengan kelas minoritas. Perbandingan antara kelas minoritas dengan kelas mayoritas disebut dengan Imbalance Ratio (IR). Semakin besar perbedaan antara kelas minoritas dengan kelas mayoritas maka nilai dari Imbalance Ratio (IR) semakin besar. Ketidakseimbangan dataset pada data mining adalah masalah yang serius. Dataset yang tidak seimbang menyebabkan misleading atau kesesatan dalam Hasil klasifikasi dimana data kelas minoritas sering diklasifikasikan sebagai kelas mayoritas. Penerapan algoritma klasifikasi tanpa memperhatikan keseimbangan kelas mengakibatkan prediksi yang baik bagi kelas mayoritas dan kelas minoritas diabaikan. Oleh karena itu pada penelitian ini diimplementasikan algoritma Syntethic Minority Over-Sampling Technique (SMOTE) untuk menyeimbangkan dataset. Penelitian ini menggunakan 4 dataset dengan Imbalance Ratio yang berbeda dan menggunakan algoritma klasifikasi C45, Naïve Bayes, K-NN, dan SVM. Kemudian dibandingkan antara sebelum dilakukan SMOTE dan setelah dilakukan SMOTE. Dari hasil penelitian yang sudah dilakukan nilai akurasi dan nilai G-mean algoritma Naïve Bayes konsisten dengan performanya pada setiap level imbalance ratio, sebelum implementasi SMOTE memiliki performa yang tidak baik, sedangkan setelah diimplementasikan SMOTE algoritma Naïve Bayes memiliki peningkatan akurasi yang konsisten. Sehingga dapat ditarik kesimpulan bahwa kombinasi SMOTE + Naïve Bayes paling efektif digunakan pada dataset imbalance dengan level yang berbeda-beda pada skema 10 fold cross validation maupun 80% data testing yang diujikan sebanyak 50 kali.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | klasifikasi dengan dataset tidak seimbang, Syntethic Minority OverSampling Technique (SMOTE) | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer |
||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 28 Jun 2022 07:35 | ||
Last Modified: | 24 Aug 2023 07:52 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/3055 |
Actions (login required)
View Item |