KLASIFIKASI MALICIOUS WEB CONTENT DENGAN ALGORITME RANDOM FOREST DAN K-NEAREST NEIGHBORS

Septian, Roni (2023) KLASIFIKASI MALICIOUS WEB CONTENT DENGAN ALGORITME RANDOM FOREST DAN K-NEAREST NEIGHBORS. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (966kB)
[img] Text (BAB I)
BAB I.pdf

Download (176kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (639kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (590kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB V)
BAB V.pdf

Download (67kB)
[img] Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf
Restricted to Registered users only

Download (184kB)
[img] Other (SOURCE CODE)
Source Code - Roni Septian.rar
Restricted to Repository staff only

Download (75kB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (556kB)

Abstract

Tujuan dari penelitian ini adalah untuk mengklasifikasi dataset phising menggunakan algoritma Random Forest dan KNN. Dataset yang digunakan berasal dari Kaggle dan telah diproses serta dibagi menjadi data latih dan data uji. Penelitian ini dilakukan karena semakin meningkatnya kerentanan pada aplikasi web dan internet yang dapat dimanfaatkan oleh pihak yang tidak bertanggung jawab dengan menggunakan metode phising, yang dapat berdampak pada kerugian pada pengguna internet dan website. Pada proses klasifikasi menggunakan Random Forest, dibuat sebuah model dengan data latih dan kemudian digunakan untuk memprediksi label kelas pada data uji. Selanjutnya, akurasi model dihitung dengan membandingkan label kelas prediksi dengan label kelas sebenarnya pada data uji. Hal yang sama dilakukan pada proses klasifikasi menggunakan KNN. Hasil penelitian menunjukkan bahwa model Random Forest memiliki performa yang lebih baik dalam hal akurasi dan presisi, serta dalam membedakan kelas positif dan negatif pada data pengujian. Hal ini dibuktikan dengan nilai ROCAUC yang lebih tinggi pada model Random Forest. Selain itu, perhitungan selisih tiap metriks menunjukkan bahwa model Random Forest memiliki skor yang lebih tinggi dalam setiap metrik evaluasi yang digunakan, meskipun perbedaannya bervariasi dari 0,22% hingga 4,28%. Rata-rata selisih tiap metriks kemudian dihitung dan dibagi menjadi 4, sehingga didapatkan hasil 2,47%. Berdasarkan keseluruhan metriks evaluasi yang sudah dilakukan, dapat disimpulkan bahwa kinerja model Random Forest lebih baik dibandingkan dengan K-nearest neighbour dalam klasifikasi data.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Ashari, Wahid Miftahul
Uncontrolled Keywords: Random Forest, K-Nearest Neighbors (KNN), Confusion Matrix, ROC-AUC, Phising
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Ilmu Komputer > Teknik Komputer
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 02 Nov 2023 02:25
Last Modified: 02 Nov 2023 02:25
URI: http://eprints.amikom.ac.id/id/eprint/22473

Actions (login required)

View Item View Item