ANALISIS KINERJA RANDOM FOREST DALAM KLASIFIKASI IMBALANCE DATASETS MENGGUNAKAN SMOTE DAN NEAR MISS

Aufa, Muhammad Rifki (2025) ANALISIS KINERJA RANDOM FOREST DALAM KLASIFIKASI IMBALANCE DATASETS MENGGUNAKAN SMOTE DAN NEAR MISS. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (633kB)
[img] Text (BAB I)
BAB I.pdf

Download (175kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (620kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (541kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB V)
BAB V.pdf

Download (115kB)
[img] Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf
Restricted to Registered users only

Download (237kB)
[img] Archive (SOURCE CODE)
Sourcecode - 21.12.1980.zip
Restricted to Repository staff only

Download (4kB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (431kB)

Abstract

Ketidakseimbangan dalam dataset menjadi tantangan dalam klasifikasi, terutama dalam dataset di bidang- bidang penting seperti Kesehatan, keuangan, dan pemeliharaan mesin. Penelitian ini akan membandingkan kinerja metode SyntheticMinority Over-sampling Technique (SMOTE) dan NearMiss dalam menanganiketidakseimbangan data dengan menggunakan algoritma Random Forest. Sepuluhdataset yang digunakan dalam penelitian ini mencakup Credit card Fraud,Predictive Maintenance, Diabetes, Spam SMS, Customer Churn, Breast Cancer,Spam Email, dan Employee Performance. Hasil evaluasi di dalam penelitian ini menunjukan bahwa SMOTE memberikan hasil yang baik dalam empat dari sepuluh dataset berdasarkan metrik precision,recall, F1-score, ROC AUC Score dan Confusion Matrix apalagi dalam kasusdataset di mana kelas minoritas memiliki jumlah data yang sangat sedikit.Sebaliknya, NearMiss menunjukan performa yang lebih baik dalam satu dataset,sedangkan lima dataset lainnya memiliki hasil yang seimbang antara kedua metode. Secara keseluruhan, dalam penelitian ini SMOTE cenderung lebih efektif dalam meningkatkan recall kelas minoritas, sedangkan NearMiss dapat mengurangibias dalam model dengan menyeimbangkan jumlah sampel dataset. Hasil daripenelitian ini menjadi temuan dan memberikan wawasan tentang bagaimanapemilihan metode penyeimbangan dataset dapat mempengaruhi performa modelklasifikasi dalam berbagai scenario dataset.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Pristyanto, Yoga
Uncontrolled Keywords: Klasifikasi, Ketidakseimbangan Data, SMOTE, Nearmiss, Random Forest
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus
Divisions: Fakultas Ilmu Komputer > Sistem Informasi
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 13 Nov 2025 06:40
Last Modified: 13 Nov 2025 06:40
URI: http://eprints.amikom.ac.id/id/eprint/30993

Actions (login required)

View Item View Item