PENANGANAN MISSING VALUE PADA DATASET PROBABILITY WATER UNTUK KLASIFIKASI AIR MINUM MENGGUNKAN PENDEKATAN CENTER OF TEDENCY

Masulili, Deni Rahman (2025) PENANGANAN MISSING VALUE PADA DATASET PROBABILITY WATER UNTUK KLASIFIKASI AIR MINUM MENGGUNKAN PENDEKATAN CENTER OF TEDENCY. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (915kB)
[img] Text (BAB I)
BAB I.pdf

Download (169kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (662kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (271kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (806kB)
[img] Text (BAB V)
BAB V.pdf

Download (83kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (91kB)
[img] Archive (SOURCE CODE)
Sourcecode - 21.11.4377.zip
Restricted to Repository staff only

Download (605kB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (945kB)

Abstract

Kualitas air minum merupakan faktor krusial dalam menjaga kesehatanmasyarakat. Namun, seringkali data kualitas air mengalami missing value, yang dapat mengurangi akurasi dalam analisis dan klasifikasi. Salah satu pendekatanuntuk menangani missing value adalah metode Center of Tendency (mean, median,dan modus). Penelitian ini bertujuan untuk mengevaluasi efektivitas metodeimputasi ini dalam meningkatkan akurasi klasifikasi potabilitas air. Data yang digunakan dalam penelitian ini mengandung berbagai parameter kualitas air, seperti pH, kandungan zat padat terlarut, tingkat kekeruhan, serta kandungan kimia lainnya. Metode penelitian ini melibatkan penerapan algoritma Naïve Bayes,Decision Tree, dan SVM untuk mengklasifikasikan potabilitas air setelah dilakukan imputasi dengan metode Center of Tendency. Evaluasi dilakukan menggunakanconfusion matrix, yang mengukur performa model berdasarkan akurasi, precision, recall, dan f1-score. Dataset dibagi menjadi data latih dan data uji untuk setiap metode imputasi yang digunakan, dan hasil klasifikasi dibandingkan untuk menilaidampak metode imputasi terhadap performa model. Hasil penelitian menunjukkan bahwa metode Center of Tendency memberikan peningkatan akurasi dalam klasifikasi potabilitas air dibandingkan dengan dataset asli tanpa imputasi. Metode median cenderung menghasilkan performa terbaik dibandingkan mean dan modus dalam beberapa skenario. Temuan ini dapat dimanfaatkan oleh peneliti dan praktisi dalam bidang data mining danpengolahan data lingkungan untuk meningkatkan keandalan analisis data dengan missing value. Penelitian lebih lanjut dapat dilakukan dengan menerapkan metodeimputasi lain atau menggunakan dataset yang lebih luas untuk meningkatkan generalisasi hasil.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Utama, Hastari
Uncontrolled Keywords: Missing Value, Center Of Tedency, Klasifikasi, Confusion Matrix, Potabilitas Air
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 13 Aug 2025 07:47
Last Modified: 13 Aug 2025 07:47
URI: http://eprints.amikom.ac.id/id/eprint/30339

Actions (login required)

View Item View Item