Wicaksono, Wahyu Enggar (2024) ANALISIS KINERJA ALGORITMA MACHINE LEARNING DENGAN METODE PREPROCESSING DATA ONE HOT ENCODING DAN LABEL ENCODING DALAM PREDIKSI PENYAKIT DIABETES. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (2MB) |
|
Text (BAB I)
BAB I.pdf Download (200kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (1MB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (347kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (1MB) |
|
Text (BAB V)
BAB V.pdf Download (32kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (170kB) |
|
Archive (SOURCE CODE)
Sourcecode - 20.83.0495.zip Restricted to Repository staff only Download (944kB) |
|
Text (PUBLIKASI)
Publikasi.pdf Restricted to Repository staff only Download (491kB) |
Abstract
Diabetes adalah penyakit yang terjadi karena kadar gula dalam darah terlalu tinggi. Gula yang seharusnya diubah menjadi energi tidak dapat diserap oleh tubuh, sehingga menumpuk dalam sel. Menurut International Diabetes Federation (IDF), pada tahun 2021 terdapat 537 juta penderita diabetes di seluruh dunia, termasuk 19 juta di Indonesia, dan jumlah ini terus bertambah setiap tahun. Saat ini, teknologi machine learning bisa digunakan untuk memprediksi risiko diabetes. Namun, hasil prediksi ini sangat bergantung pada dataset, metode preprocessing data, dan algoritma yang digunakan. Penelitian ini bertujuan untuk menganalisis kinerja tiga algoritma machine learning Support Vector Machine (SVM), Random Forest dan Naive Bayes dalam memprediksi diabetes dengan menggunakan dua teknik preprocessing data: One Hot Encoding dan Label Encoding. Dataset yang digunakan adalah Diabetes Prediction Dataset. Penelitian ini membandingkan bagaimana setiap algoritma beradaptasi dengan teknik encoding yang berbeda dan mengevaluasi kinerjanya menggunakan metrik accuracy, precision, recall dan f1score melalui metodologi pengujian yang terstruktur. Hasil penelitian menunjukkan bahwa di antara ketiga algoritma tersebut, Random Forest dengan preprocessing One Hot Encoding dan Label Encoding memiliki kinerja terbaik. Dalam hal precision, One Hot Encoding lebih unggul dengan selisih 0,22% dibandingkan Label Encoding. Sebaliknya, dalam hal recall, Label Encoding lebih baik dengan selisih 0,12% dibandingkan One Hot Encoding. Untuk parameter accuracy dan f1score, keduanya memberikan hasil yang sama, yaitu accuracy sebesar 96,68% dan f1-score sebesar 78,07%.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Machine Learning, Preprocessing, One Hot Encoding, Label Encoding | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer | ||
Divisions: | Fakultas Ilmu Komputer > Teknik Komputer | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 12 Nov 2024 04:18 | ||
Last Modified: | 12 Nov 2024 04:18 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/27957 |
Actions (login required)
View Item |