ANALISIS KINERJA ALGORITMA MACHINE LEARNING DENGAN METODE PREPROCESSING DATA ONE HOT ENCODING DAN LABEL ENCODING DALAM PREDIKSI PENYAKIT DIABETES

Wicaksono, Wahyu Enggar (2024) ANALISIS KINERJA ALGORITMA MACHINE LEARNING DENGAN METODE PREPROCESSING DATA ONE HOT ENCODING DAN LABEL ENCODING DALAM PREDIKSI PENYAKIT DIABETES. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (2MB)
[img] Text (BAB I)
BAB I.pdf

Download (200kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (347kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB V)
BAB V.pdf

Download (32kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (170kB)
[img] Archive (SOURCE CODE)
Sourcecode - 20.83.0495.zip
Restricted to Repository staff only

Download (944kB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (491kB)

Abstract

Diabetes adalah penyakit yang terjadi karena kadar gula dalam darah terlalu tinggi. Gula yang seharusnya diubah menjadi energi tidak dapat diserap oleh tubuh, sehingga menumpuk dalam sel. Menurut International Diabetes Federation (IDF), pada tahun 2021 terdapat 537 juta penderita diabetes di seluruh dunia, termasuk 19 juta di Indonesia, dan jumlah ini terus bertambah setiap tahun. Saat ini, teknologi machine learning bisa digunakan untuk memprediksi risiko diabetes. Namun, hasil prediksi ini sangat bergantung pada dataset, metode preprocessing data, dan algoritma yang digunakan. Penelitian ini bertujuan untuk menganalisis kinerja tiga algoritma machine learning Support Vector Machine (SVM), Random Forest dan Naive Bayes dalam memprediksi diabetes dengan menggunakan dua teknik preprocessing data: One Hot Encoding dan Label Encoding. Dataset yang digunakan adalah Diabetes Prediction Dataset. Penelitian ini membandingkan bagaimana setiap algoritma beradaptasi dengan teknik encoding yang berbeda dan mengevaluasi kinerjanya menggunakan metrik accuracy, precision, recall dan f1score melalui metodologi pengujian yang terstruktur. Hasil penelitian menunjukkan bahwa di antara ketiga algoritma tersebut, Random Forest dengan preprocessing One Hot Encoding dan Label Encoding memiliki kinerja terbaik. Dalam hal precision, One Hot Encoding lebih unggul dengan selisih 0,22% dibandingkan Label Encoding. Sebaliknya, dalam hal recall, Label Encoding lebih baik dengan selisih 0,12% dibandingkan One Hot Encoding. Untuk parameter accuracy dan f1score, keduanya memberikan hasil yang sama, yaitu accuracy sebesar 96,68% dan f1-score sebesar 78,07%.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Kuswanto, Jeki
Uncontrolled Keywords: Machine Learning, Preprocessing, One Hot Encoding, Label Encoding
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
Divisions: Fakultas Ilmu Komputer > Teknik Komputer
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 12 Nov 2024 04:18
Last Modified: 12 Nov 2024 04:18
URI: http://eprints.amikom.ac.id/id/eprint/27957

Actions (login required)

View Item View Item