TEKNIK BALANCING DATASET MENGGUNAKAN ALGORITMA ADASYN DAN BORDERLINE-SMOTE

Handayani, Trias (2023) TEKNIK BALANCING DATASET MENGGUNAKAN ALGORITMA ADASYN DAN BORDERLINE-SMOTE. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (674kB)
[img] Text (BAB I)
BAB I.pdf

Download (176kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (659kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (214kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (323kB)
[img] Text (BAB V)
BAB V.pdf

Download (36kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (231kB)
[img] Archive (SOURCE CODE)
Source Code-19.11.2733-Trias Handayani - 2733_Trias Handayani.zip
Restricted to Repository staff only

Download (95kB)
[img] Text (PUBLIKASI)
Publikasi-19.11.2733-Trias Handayani - 2733_Trias Handayani.pdf
Restricted to Repository staff only

Download (457kB)

Abstract

Ketidakseimbangan dataset merupakan permasalahan umum yang sering ditemukan pada klasifikasi. Ketidakseimbangan dataset merupakan kondisi dimana sebuah dataset memiliki perbedaan jumlah data antara kelas satu dengan lainnya. Masalah ketidakseimbangan ini mengakibatkan salah klasifikasi yang dapat menurunkan kinerja dari model klasifikasi. Penurunan kinerja model terjadi karena data lebih mengenali data kelas mayoritas yang lebih dominan sehingga kelas minoritas sering salah diklasifikasikan. Untuk mengatasi permasalahan klasifikasi ini, maka dataset diseimbangkan dengan meningkatkan data di kelas minoritas. Pada penelitian ini, ADASYN dan Borderline-SMOTE digunakan untuk menyeimbangkan dataset. Dataset yang digunakan adalah dataset lung cancer yang tidak seimbang. Random Forest diterapkan sebagai algoritma klasikasi dengan nilai n_estimators=100 dan divalidasi menggunakan 5 stratified k-fold cross validation. Hasil penelitian menunjukan adanya peningkatan kinerja berdasarkan nilai AUC setelah dilakukan penyeimbangan baik menggunakan ADASYN maupun Borderline-SMOTE. Peningkatan kinerja berdasarkan nilai AUC yang terjadi antara 1%-13%. Pada beberapa k-fold ADASYN dan Borderline-SMOTE menghasilkan nilai AUC sebesar 100% yang menandakan bahwa model mampu mengklasifikasikan seluruh data dengan sempurna. Dari k-fold 2,4, dan 5 hasil nilai AUC menunjukan bahwa ADASYN lebih unggul dari Borderline-SMOTE

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Hayaty, Mardhiya
Uncontrolled Keywords: Data Tidak Seimbang, Oversampling, ADASYN, Borderline SMOTE, Random Forest
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 13 Apr 2023 02:25
Last Modified: 26 Jul 2023 04:02
URI: http://eprints.amikom.ac.id/id/eprint/18472

Actions (login required)

View Item View Item