Handayani, Trias (2023) TEKNIK BALANCING DATASET MENGGUNAKAN ALGORITMA ADASYN DAN BORDERLINE-SMOTE. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (674kB) |
|
Text (BAB I)
BAB I.pdf Download (176kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (659kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (214kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (323kB) |
|
Text (BAB V)
BAB V.pdf Download (36kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (231kB) |
|
Archive (SOURCE CODE)
Source Code-19.11.2733-Trias Handayani - 2733_Trias Handayani.zip Restricted to Repository staff only Download (95kB) |
|
Text (PUBLIKASI)
Publikasi-19.11.2733-Trias Handayani - 2733_Trias Handayani.pdf Restricted to Repository staff only Download (457kB) |
Abstract
Ketidakseimbangan dataset merupakan permasalahan umum yang sering ditemukan pada klasifikasi. Ketidakseimbangan dataset merupakan kondisi dimana sebuah dataset memiliki perbedaan jumlah data antara kelas satu dengan lainnya. Masalah ketidakseimbangan ini mengakibatkan salah klasifikasi yang dapat menurunkan kinerja dari model klasifikasi. Penurunan kinerja model terjadi karena data lebih mengenali data kelas mayoritas yang lebih dominan sehingga kelas minoritas sering salah diklasifikasikan. Untuk mengatasi permasalahan klasifikasi ini, maka dataset diseimbangkan dengan meningkatkan data di kelas minoritas. Pada penelitian ini, ADASYN dan Borderline-SMOTE digunakan untuk menyeimbangkan dataset. Dataset yang digunakan adalah dataset lung cancer yang tidak seimbang. Random Forest diterapkan sebagai algoritma klasikasi dengan nilai n_estimators=100 dan divalidasi menggunakan 5 stratified k-fold cross validation. Hasil penelitian menunjukan adanya peningkatan kinerja berdasarkan nilai AUC setelah dilakukan penyeimbangan baik menggunakan ADASYN maupun Borderline-SMOTE. Peningkatan kinerja berdasarkan nilai AUC yang terjadi antara 1%-13%. Pada beberapa k-fold ADASYN dan Borderline-SMOTE menghasilkan nilai AUC sebesar 100% yang menandakan bahwa model mampu mengklasifikasikan seluruh data dengan sempurna. Dari k-fold 2,4, dan 5 hasil nilai AUC menunjukan bahwa ADASYN lebih unggul dari Borderline-SMOTE
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Data Tidak Seimbang, Oversampling, ADASYN, Borderline SMOTE, Random Forest | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer | ||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 13 Apr 2023 02:25 | ||
Last Modified: | 26 Jul 2023 04:02 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/18472 |
Actions (login required)
View Item |