@mastersthesis{universitasamikomyogyakarta31791, school = {Universitas AMIKOM Yogyakarta}, month = {February}, year = {2026}, title = {PENGEMBANGAN MODEL PREDIKSI DIABETES BERBASIS HYBRID ENSEMBLE DENGAN INTEGRASI SMOTE UNTUK OPTIMASI SKRINING DI SISTEM INFORMASI MANAJEMEN RUMAH SAKIT}, author = {Muh Ikbal Sodikin}, url = {https://eprints.amikom.ac.id/id/eprint/31791/}, keywords = {Prediksi Diabetes, Hybrid Ensemble, SMOTE, XGBoost, Sistem Informasi Manajemen Rumah Sakit, Machine Learning, Weighted Voting, Feature Engineering, Optimasi Threshold, Skrining Klinis, Diabetes Mellitus, Hospital Management Information System, Machine learning, Weighted Voting, Feature Enggineering, Threshold Optimization, Clinic Screening,}, abstract = {Diabetes mellitus merupakan masalah kesehatan masyarakat Indonesia yang semakin meningkat dengan prevalensi 10,9\% pada populasi dewasa. Tantangan utama dalam sistem layanan kesehatan adalah fenomena underdiagnosis, di mana sekitar 70\% kasus diabetes tidak terdiagnosis hingga stadium lanjut. Penelitian ini bertujuan mengembangkan model prediksi diabetes yang akurat dengan memanfaatkan data klinis dasar dari Sistem Informasi Manajemen Rumah Sakit (SIMRS) melalui pendekatan hybrid ensemble machine learning. Metode penelitian menggunakan data retrospektif dari SIMRS sebanyak 958 sampel dengan 7 variabel klinis awal. Tahapan penelitian meliputi: (1) prapemrosesan data dan validasi klinis, (2) advanced feature engineering yang mengembangkan 7 fitur menjadi 23 fitur melalui transformasi polynomial, clinical flags, dan interaction terms, (3) penanganan ketidakseimbangan kelas menggunakan Synthetic Minority Over-sampling Technique (SMOTE), (4) pengembangan model hybrid ensemble yang mengkombinasikan XGBoost, LightGBM, Random Forest, dan Gradient Boosting dengan mekanisme weighted voting, serta (5) optimasi threshold klasifikasi. Hasil penelitian menunjukkan bahwa proses feature engineering berhasil meningkatkan kapasitas prediktif dataset dengan peningkatan mutual information sebesar 87,5\%. SMOTE efektif menangani ketidakseimbangan kelas ekstrem (rasio 1:4.04) dengan meningkatkan distribusi kelas minoritas dari 19,8\% menjadi 33,3\%. Model hybrid ensemble dengan konfigurasi bobot optimal (XGBoost: 0.40, LightGBM: 0.30, Random Forest: 0.20, Gradient Boosting: 0.10) mencapai akurasi 82,64\%, mengungguli semua model individual. Performa model meningkat signifikan dengan recall 51,72\% (+6,89\% dari XGBoost individual), precision 57,69\% (+9,54\%), dan F1-score 54,55\% (+8,12\%). Optimasi threshold menemukan nilai optimal pada 0,504 (bukan 0,5 konvensional) yang memberikan balance terbaik antara precision dan recall untuk aplikasi skrining klinis. Penelitian ini memberikan kontribusi dalam pengembangan arsitektur weighted voting hybrid ensemble yang mengoptimalkan kombinasi empat algoritma machine learning, integrasi SMOTE dengan hybrid ensemble untuk data tidak seimbang, dan metodologi threshold optimization untuk aplikasi klinis. Model yang dikembangkan berpotensi diimplementasikan sebagai sistem pendukung keputusan klinis untuk skrining diabetes di fasilitas pelayanan kesehatan Indonesia, dengan rekomendasi untuk validasi multi-center dan integrasi dengan workflow klinis yang ada.} }