Masulili, Deni Rahman (2025) PENANGANAN MISSING VALUE PADA DATASET PROBABILITY WATER UNTUK KLASIFIKASI AIR MINUM MENGGUNKAN PENDEKATAN CENTER OF TEDENCY. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
![]() |
Text (COVER-ABSTRAK)
COVER.pdf Download (915kB) |
![]() |
Text (BAB I)
BAB I.pdf Download (169kB) |
![]() |
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (662kB) |
![]() |
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (271kB) |
![]() |
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (806kB) |
![]() |
Text (BAB V)
BAB V.pdf Download (83kB) |
![]() |
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (91kB) |
![]() |
Archive (SOURCE CODE)
Sourcecode - 21.11.4377.zip Restricted to Repository staff only Download (605kB) |
![]() |
Text (PUBLIKASI)
Publikasi.pdf Restricted to Repository staff only Download (945kB) |
Abstract
Kualitas air minum merupakan faktor krusial dalam menjaga kesehatanmasyarakat. Namun, seringkali data kualitas air mengalami missing value, yang dapat mengurangi akurasi dalam analisis dan klasifikasi. Salah satu pendekatanuntuk menangani missing value adalah metode Center of Tendency (mean, median,dan modus). Penelitian ini bertujuan untuk mengevaluasi efektivitas metodeimputasi ini dalam meningkatkan akurasi klasifikasi potabilitas air. Data yang digunakan dalam penelitian ini mengandung berbagai parameter kualitas air, seperti pH, kandungan zat padat terlarut, tingkat kekeruhan, serta kandungan kimia lainnya. Metode penelitian ini melibatkan penerapan algoritma Naïve Bayes,Decision Tree, dan SVM untuk mengklasifikasikan potabilitas air setelah dilakukan imputasi dengan metode Center of Tendency. Evaluasi dilakukan menggunakanconfusion matrix, yang mengukur performa model berdasarkan akurasi, precision, recall, dan f1-score. Dataset dibagi menjadi data latih dan data uji untuk setiap metode imputasi yang digunakan, dan hasil klasifikasi dibandingkan untuk menilaidampak metode imputasi terhadap performa model. Hasil penelitian menunjukkan bahwa metode Center of Tendency memberikan peningkatan akurasi dalam klasifikasi potabilitas air dibandingkan dengan dataset asli tanpa imputasi. Metode median cenderung menghasilkan performa terbaik dibandingkan mean dan modus dalam beberapa skenario. Temuan ini dapat dimanfaatkan oleh peneliti dan praktisi dalam bidang data mining danpengolahan data lingkungan untuk meningkatkan keandalan analisis data dengan missing value. Penelitian lebih lanjut dapat dilakukan dengan menerapkan metodeimputasi lain atau menggunakan dataset yang lebih luas untuk meningkatkan generalisasi hasil.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Missing Value, Center Of Tedency, Klasifikasi, Confusion Matrix, Potabilitas Air | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer | ||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 13 Aug 2025 07:47 | ||
Last Modified: | 13 Aug 2025 07:47 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/30339 |
Actions (login required)
![]() |
View Item |