PENGARUH BALANCING DATA DAN NORMALISASI DATA PADA PERFORMA K-NEAREST NEIGHBOR DALAM KLASIFIKASI KUALITAS WINE

Gemilang, Indra Putra (2022) PENGARUH BALANCING DATA DAN NORMALISASI DATA PADA PERFORMA K-NEAREST NEIGHBOR DALAM KLASIFIKASI KUALITAS WINE. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (615kB)
[img] Text (BAB I)
BAB I.pdf

Download (124kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (825kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (280kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (592kB)
[img] Text (BAB V)
BAB V.pdf

Download (76kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (122kB)
[img] Other (SOURCE CODE)
Source Code 19.11.2780 Indra Putra Gemilang.rar
Restricted to Repository staff only

Download (94kB)
[img] Text (PUBLIKASI)
Publikasi 19.11.2780 Indra Putra Gemilang.pdf
Restricted to Repository staff only

Download (371kB)

Abstract

K-Nearest neighbors atau yang biasa disebut (K-NN) merupakan algoritma supervised learning dalam machine learning K-NN biasanya digunakan untuk klasifikasi dan regresi, Sebelum data bisa digunakan sebagai klasifikasi data harus di proses terlebih dahulu dan proses ini disebut pre-processing ada banyak cara teknik pre-processing data diantaranya adalah normalisasi data dan balancing data, Normalisasi data adalah proses untuk menyamakan rentang nilai dari yang berbeda menjadi sama sedangkan balancing data adalah proses menyamakan data kelas yang tidak imbang menjadi imbang. Data yang akan digunakan untuk penelitian ini adalah data kualitas red wine yang di dapatkan dari website Kaggle.com dan data ini bersifat publik. Data set ini memiliki 1599 data dan memiliki 12 atribut, untuk atribut yang digunakan untuk klasifikasi bernama quality yang berisi nilai 1-10 semakin besar nilainya semakin tinggi kualitas wine tersebut. Penelitian ini berfokuskan pada pengaruh proses preprocessing data antara balancing data dan normalisasi data pada performa KNearest Neighbors dalam mengklasifikasi data dan menentukan jumlah KNeighbors yang di perlukan untuk mencapai akurasi tinggi. Metode yang mendapatkan akurasi tertinggi pada penelitian ini adalah metode K-NN dengan Min-Max dengan hasil akurasi sebanyak 80.75% dengan k = 17, yang kedua yaitu metode K-NN dengan Min-Max dan SMOTE dengan Akurasi sebanyak 79.75% dengan k = 19, ketiga yaitu metode K-NN saja dengan akurasi sebanyak 75% dengan k = 23 dan terakhir yaitu metode K-NN dengan SMOTE dengan akurasi sebanyak 74.5% dengan k = 23

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
-, Kusrini
Uncontrolled Keywords: K-Nearest Neighbors, Normalisasi Data, Balancing Data
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 01 Feb 2023 04:48
Last Modified: 28 Jul 2023 07:04
URI: http://eprints.amikom.ac.id/id/eprint/15703

Actions (login required)

View Item View Item