Gemilang, Indra Putra (2022) PENGARUH BALANCING DATA DAN NORMALISASI DATA PADA PERFORMA K-NEAREST NEIGHBOR DALAM KLASIFIKASI KUALITAS WINE. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (615kB) |
|
Text (BAB I)
BAB I.pdf Download (124kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (825kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (280kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (592kB) |
|
Text (BAB V)
BAB V.pdf Download (76kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (122kB) |
|
Other (SOURCE CODE)
Source Code 19.11.2780 Indra Putra Gemilang.rar Restricted to Repository staff only Download (94kB) |
|
Text (PUBLIKASI)
Publikasi 19.11.2780 Indra Putra Gemilang.pdf Restricted to Repository staff only Download (371kB) |
Abstract
K-Nearest neighbors atau yang biasa disebut (K-NN) merupakan algoritma supervised learning dalam machine learning K-NN biasanya digunakan untuk klasifikasi dan regresi, Sebelum data bisa digunakan sebagai klasifikasi data harus di proses terlebih dahulu dan proses ini disebut pre-processing ada banyak cara teknik pre-processing data diantaranya adalah normalisasi data dan balancing data, Normalisasi data adalah proses untuk menyamakan rentang nilai dari yang berbeda menjadi sama sedangkan balancing data adalah proses menyamakan data kelas yang tidak imbang menjadi imbang. Data yang akan digunakan untuk penelitian ini adalah data kualitas red wine yang di dapatkan dari website Kaggle.com dan data ini bersifat publik. Data set ini memiliki 1599 data dan memiliki 12 atribut, untuk atribut yang digunakan untuk klasifikasi bernama quality yang berisi nilai 1-10 semakin besar nilainya semakin tinggi kualitas wine tersebut. Penelitian ini berfokuskan pada pengaruh proses preprocessing data antara balancing data dan normalisasi data pada performa KNearest Neighbors dalam mengklasifikasi data dan menentukan jumlah KNeighbors yang di perlukan untuk mencapai akurasi tinggi. Metode yang mendapatkan akurasi tertinggi pada penelitian ini adalah metode K-NN dengan Min-Max dengan hasil akurasi sebanyak 80.75% dengan k = 17, yang kedua yaitu metode K-NN dengan Min-Max dan SMOTE dengan Akurasi sebanyak 79.75% dengan k = 19, ketiga yaitu metode K-NN saja dengan akurasi sebanyak 75% dengan k = 23 dan terakhir yaitu metode K-NN dengan SMOTE dengan akurasi sebanyak 74.5% dengan k = 23
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | K-Nearest Neighbors, Normalisasi Data, Balancing Data | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data | ||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 01 Feb 2023 04:48 | ||
Last Modified: | 28 Jul 2023 07:04 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/15703 |
Actions (login required)
View Item |