OPTIMASI PREDIKSI DIABETES PADA DATASET PIMA INDIANS MELALUI PENGGABUNGAN ALGORITMA K-NEAREST NEIGHBORS (KNN) DAN LIGHTGBM DENGAN PENDEKATAN EXPLORATORY DATA ANALYSIS (EDA)

Pramudyantoro, Arvi (2024) OPTIMASI PREDIKSI DIABETES PADA DATASET PIMA INDIANS MELALUI PENGGABUNGAN ALGORITMA K-NEAREST NEIGHBORS (KNN) DAN LIGHTGBM DENGAN PENDEKATAN EXPLORATORY DATA ANALYSIS (EDA). S2 - Magister thesis, Universitas AMIKOM Yogyakarta.

[img] Text (THESIS)
22.51.1183 Arvi Pramudyantoro.pdf

Download (4MB)

Abstract

Penelitian dengan judul "Optimasi Prediksi Diabetes pada Dataset Pima Indians melalui Penggabungan Algoritma K-Nearest Neighbors (KNN) dan LightGBM dengan Pendekatan Exploratory Data Analysis (EDA)." Bertujuan untuk meningkatkan akurasi prediksi diabetes dengan memanfaatkan EDA untuk mengidentifikasi karakteristik penting dalam dataset Pima Indians dan mengoptimalkan model prediksi menggunakan algoritma KNN dan LightGBM. Langkah-langkah penelitian meliputi pengumpulan dan pembersihan data, deteksi dan penanganan nilai yang hilang, serta feature engineering untuk menciptakan fitur-fitur baru yang lebih relevan dalam mendeteksi diabetes. Beberapa fitur baru yang dihasilkan antara lain Risiko Rendah Diabetes, Berat Badan Ideal, Kehamilan Berdasarkan Umur, dan Kadar Glukosa dan Tekanan Darah Normal. Teknik visualisasi data seperti histogram, scatter plot, dan heatmap digunakan untuk memahami struktur dan pola data. Penggunaan EDA berhasil mengidentifikasi hubungan kuat antara kadar glukosa darah dan kemungkinan diabetes serta membantu dalam pembersihan dan transformasi data. Kombinasi algoritma KNN dan LightGBM yang dioptimasi menunjukkan peningkatan akurasi yang signifikan. Sebelum optimasi, akurasi KNN dan LightGBM masing-masing adalah 86.34% dan 88.20%. Setelah optimasi, akurasi meningkat menjadi 91.30% untuk kedua model. Teknik stacking juga menunjukkan hasil prediksi yang lebih stabil dan akurat dengan akurasi sebesar 95.65%. Penggabungan algoritma KNN dan LightGBM yang dioptimasi menggunakan teknik EDA dan feature engineering dapat meningkatkan akurasi prediksi diabetes secara signifikan. Teknik visualisasi data dan analisis statistik deskriptif membantu dalam memahami struktur dan pola data, yang berkontribusi pada peningkatan performa model prediksi.

Item Type: Thesis (S2 - Magister)
Contributor:
Pembimbing
Utami, Ema
Ariatmanto, Dhani
Uncontrolled Keywords: Prediksi Diabetes, Pima Indians, KNN, LightGBM, Exploratory Data Analysis (EDA)
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus
Divisions: Pascasarjana Magister Informatika > Magister Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 24 Mar 2025 01:48
Last Modified: 24 Mar 2025 01:48
URI: http://eprints.amikom.ac.id/id/eprint/29012

Actions (login required)

View Item View Item