Septian, Roni (2023) KLASIFIKASI MALICIOUS WEB CONTENT DENGAN ALGORITME RANDOM FOREST DAN K-NEAREST NEIGHBORS. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (966kB) |
|
Text (BAB I)
BAB I.pdf Download (176kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (639kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (590kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (1MB) |
|
Text (BAB V)
BAB V.pdf Download (67kB) |
|
Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf Restricted to Registered users only Download (184kB) |
|
Other (SOURCE CODE)
Source Code - Roni Septian.rar Restricted to Repository staff only Download (75kB) |
|
Text (PUBLIKASI)
Publikasi.pdf Restricted to Repository staff only Download (556kB) |
Abstract
Tujuan dari penelitian ini adalah untuk mengklasifikasi dataset phising menggunakan algoritma Random Forest dan KNN. Dataset yang digunakan berasal dari Kaggle dan telah diproses serta dibagi menjadi data latih dan data uji. Penelitian ini dilakukan karena semakin meningkatnya kerentanan pada aplikasi web dan internet yang dapat dimanfaatkan oleh pihak yang tidak bertanggung jawab dengan menggunakan metode phising, yang dapat berdampak pada kerugian pada pengguna internet dan website. Pada proses klasifikasi menggunakan Random Forest, dibuat sebuah model dengan data latih dan kemudian digunakan untuk memprediksi label kelas pada data uji. Selanjutnya, akurasi model dihitung dengan membandingkan label kelas prediksi dengan label kelas sebenarnya pada data uji. Hal yang sama dilakukan pada proses klasifikasi menggunakan KNN. Hasil penelitian menunjukkan bahwa model Random Forest memiliki performa yang lebih baik dalam hal akurasi dan presisi, serta dalam membedakan kelas positif dan negatif pada data pengujian. Hal ini dibuktikan dengan nilai ROCAUC yang lebih tinggi pada model Random Forest. Selain itu, perhitungan selisih tiap metriks menunjukkan bahwa model Random Forest memiliki skor yang lebih tinggi dalam setiap metrik evaluasi yang digunakan, meskipun perbedaannya bervariasi dari 0,22% hingga 4,28%. Rata-rata selisih tiap metriks kemudian dihitung dan dibagi menjadi 4, sehingga didapatkan hasil 2,47%. Berdasarkan keseluruhan metriks evaluasi yang sudah dilakukan, dapat disimpulkan bahwa kinerja model Random Forest lebih baik dibandingkan dengan K-nearest neighbour dalam klasifikasi data.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Random Forest, K-Nearest Neighbors (KNN), Confusion Matrix, ROC-AUC, Phising | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data | ||
Divisions: | Fakultas Ilmu Komputer > Teknik Komputer | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 02 Nov 2023 02:25 | ||
Last Modified: | 02 Nov 2023 02:25 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/22473 |
Actions (login required)
View Item |