Kurniawan, Widya (2021) ANALISIS KOMPARASI ALGORITMA SUPPORT VECTOR MACHINE DAN RANDOM FOREST UNTUK KLASIFIKASI TINGKAT PELANGGARAN MAHASISWA DI UNIVERSITAS (Studi Kasus: Universitas Darussalam Gontor). S2 - Magister thesis, Universitas AMIKOM Yogyakarta.
Text
19.51.1225_Widya Kurniawan.pdf - Published Version Download (8MB) |
Abstract
Universitas Darussalam (UNIDA) Gontor merupakan perguruan tinggi pesantren. Sistem pesantren mewajibkan mahasiswanya tinggal didalam kampus dengan ber-asrama. Meningkatnya pelanggaran ditunjukan dengan banyaknya data rekap pelanggaran, semester genap tahun 2019/2020 terdapat 1.478 kasus pelanggaran. Pada penelitian ini teknik data mining dilakukan dengan membandingkan antar algoritma untuk mengklasifikasikan data pelanggaran menggunakan algoritma Support Vector Machine dan Random Forest. Penelitian dilakukan untuk membantu sistem dalam pengklasifikasian pelanggaran yang baru dimasukan, tanpa harus memprediksi kategorinya. Penelitian ini menggunakan dua data dari sumber sama dengan kuantitas dan kualitas berbeda. Digunakan 9 alur tahapan pada penelitian, yaitu membangun dataset, Text Preprocessing yang didalamnya memiliki 3 tahapan, dilanjut Feature Selection, Text Representation, dan Application of Text Mining Techniques. Proses perhitungan dilihat dari performa akurasinya antara algoritma biasa dengan dilakukan optimalisasi stemming. Pada SVM ditambah optimalisasi menggunakan OvO. Uji coba dengan K-fold Validation, tahap evaluasi menggunakan confussion matrix, dan terakhir perbandingan akurasi dari semua proses yang dilakukan dengan kedua data yang digunakan. Ketepatan Algoritma SVM dalam mengklasifikasikan dataset pertama dan kedua, dengan metode stemming menghasilkan akurasi 98,9% dan 99,5% lebih tinggi dari RF yang hanya 98,6% dan 98,2%. Uji coba dengan metode K-fold Validation SVM menghasilkan akurasi yang sama 99,5%, lebih tinggi dari hasil RF yang hanya menghasilkan 98,9% dan 98,8%. Evaluasi dengan metode Confuss Matrix SVM menghasilkan akurasi sebesar 98,9% dan 99,5%, lebih tinggi dari hasil pengklasifikasian RF yang hanya 98,6% dan 99,1%. Hasil perbandingan kinerja kedua algoritma dengan 3 metode menunjukkan bahwa, data pertama dan kedua nilai rata-rata dari algoritma SVM lebih baik dari algoritma RF. Kata kunci: Support Vector Machine, Random Forest, pelanggaran, stemming
Item Type: | Thesis (S2 - Magister) | ||
---|---|---|---|
Contributor: |
|
||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data | ||
Divisions: | Pascasarjana MTI > Magister Teknik Informatika | ||
Depositing User: | Resource Center Universitas Amikom Yogyakarta | ||
Date Deposited: | 17 Jan 2022 04:08 | ||
Last Modified: | 20 Jan 2022 07:56 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/115 |
Actions (login required)
View Item |