ANALISIS KINERJA RANDOM FOREST DALAM KLASIFIKASI IMBALANCE DATASETS MENGGUNAKAN SMOTE DAN NEAR MISS

Aufa, Muhammad Rifki (2025) ANALISIS KINERJA RANDOM FOREST DALAM KLASIFIKASI IMBALANCE DATASETS MENGGUNAKAN SMOTE DAN NEAR MISS. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

	Text (COVER-ABSTRAK) COVER.pdf Download (633kB)
	Text (BAB I) BAB I.pdf Download (175kB)
	Text (BAB II) BAB II.pdf Restricted to Registered users only Download (620kB)
	Text (BAB III) BAB III.pdf Restricted to Registered users only Download (541kB)
	Text (BAB IV) BAB IV.pdf Restricted to Registered users only Download (1MB)
	Text (BAB V) BAB V.pdf Download (115kB)
	Text (DAFTAR PUSTAKA-LAMPIRAN) Daftar Pustaka dan Lampiran.pdf Restricted to Registered users only Download (237kB)
	Archive (SOURCE CODE) Sourcecode - 21.12.1980.zip Restricted to Repository staff only Download (4kB)
	Text (PUBLIKASI) Publikasi.pdf Restricted to Repository staff only Download (431kB)

Abstract

Ketidakseimbangan dalam dataset menjadi tantangan dalam klasifikasi, terutama dalam dataset di bidang- bidang penting seperti Kesehatan, keuangan, dan pemeliharaan mesin. Penelitian ini akan membandingkan kinerja metode SyntheticMinority Over-sampling Technique (SMOTE) dan NearMiss dalam menanganiketidakseimbangan data dengan menggunakan algoritma Random Forest. Sepuluhdataset yang digunakan dalam penelitian ini mencakup Credit card Fraud,Predictive Maintenance, Diabetes, Spam SMS, Customer Churn, Breast Cancer,Spam Email, dan Employee Performance. Hasil evaluasi di dalam penelitian ini menunjukan bahwa SMOTE memberikan hasil yang baik dalam empat dari sepuluh dataset berdasarkan metrik precision,recall, F1-score, ROC AUC Score dan Confusion Matrix apalagi dalam kasusdataset di mana kelas minoritas memiliki jumlah data yang sangat sedikit.Sebaliknya, NearMiss menunjukan performa yang lebih baik dalam satu dataset,sedangkan lima dataset lainnya memiliki hasil yang seimbang antara kedua metode. Secara keseluruhan, dalam penelitian ini SMOTE cenderung lebih efektif dalam meningkatkan recall kelas minoritas, sedangkan NearMiss dapat mengurangibias dalam model dengan menyeimbangkan jumlah sampel dataset. Hasil daripenelitian ini menjadi temuan dan memberikan wawasan tentang bagaimanapemilihan metode penyeimbangan dataset dapat mempengaruhi performa modelklasifikasi dalam berbagai scenario dataset.

Item Type:

Thesis (S1 - Sarjana)

Contributor:

Pembimbing
Pristyanto, Yoga

Uncontrolled Keywords:

Klasifikasi, Ketidakseimbangan Data, SMOTE, Nearmiss, Random Forest

Subjects:

000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus

Divisions:

Fakultas Ilmu Komputer > Sistem Informasi

Depositing User:

RC Universitas AMIKOM Yogyakarta

Date Deposited:

13 Nov 2025 06:40

Last Modified:

13 Nov 2025 06:40

URI:

http://eprints.amikom.ac.id/id/eprint/30993

Actions (login required)

View Item