Aufa, Muhammad Rifki (2025) ANALISIS KINERJA RANDOM FOREST DALAM KLASIFIKASI IMBALANCE DATASETS MENGGUNAKAN SMOTE DAN NEAR MISS. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
|
Text (COVER-ABSTRAK)
COVER.pdf Download (633kB) |
|
|
Text (BAB I)
BAB I.pdf Download (175kB) |
|
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (620kB) |
|
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (541kB) |
|
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (1MB) |
|
|
Text (BAB V)
BAB V.pdf Download (115kB) |
|
|
Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf Restricted to Registered users only Download (237kB) |
|
|
Archive (SOURCE CODE)
Sourcecode - 21.12.1980.zip Restricted to Repository staff only Download (4kB) |
|
|
Text (PUBLIKASI)
Publikasi.pdf Restricted to Repository staff only Download (431kB) |
Abstract
Ketidakseimbangan dalam dataset menjadi tantangan dalam klasifikasi, terutama dalam dataset di bidang- bidang penting seperti Kesehatan, keuangan, dan pemeliharaan mesin. Penelitian ini akan membandingkan kinerja metode SyntheticMinority Over-sampling Technique (SMOTE) dan NearMiss dalam menanganiketidakseimbangan data dengan menggunakan algoritma Random Forest. Sepuluhdataset yang digunakan dalam penelitian ini mencakup Credit card Fraud,Predictive Maintenance, Diabetes, Spam SMS, Customer Churn, Breast Cancer,Spam Email, dan Employee Performance. Hasil evaluasi di dalam penelitian ini menunjukan bahwa SMOTE memberikan hasil yang baik dalam empat dari sepuluh dataset berdasarkan metrik precision,recall, F1-score, ROC AUC Score dan Confusion Matrix apalagi dalam kasusdataset di mana kelas minoritas memiliki jumlah data yang sangat sedikit.Sebaliknya, NearMiss menunjukan performa yang lebih baik dalam satu dataset,sedangkan lima dataset lainnya memiliki hasil yang seimbang antara kedua metode. Secara keseluruhan, dalam penelitian ini SMOTE cenderung lebih efektif dalam meningkatkan recall kelas minoritas, sedangkan NearMiss dapat mengurangibias dalam model dengan menyeimbangkan jumlah sampel dataset. Hasil daripenelitian ini menjadi temuan dan memberikan wawasan tentang bagaimanapemilihan metode penyeimbangan dataset dapat mempengaruhi performa modelklasifikasi dalam berbagai scenario dataset.
| Item Type: | Thesis (S1 - Sarjana) | ||
|---|---|---|---|
| Contributor: |
|
||
| Uncontrolled Keywords: | Klasifikasi, Ketidakseimbangan Data, SMOTE, Nearmiss, Random Forest | ||
| Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus | ||
| Divisions: | Fakultas Ilmu Komputer > Sistem Informasi | ||
| Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
| Date Deposited: | 13 Nov 2025 06:40 | ||
| Last Modified: | 13 Nov 2025 06:40 | ||
| URI: | http://eprints.amikom.ac.id/id/eprint/30993 |
Actions (login required)
![]() |
View Item |

