STUDI PENGARUH SELEKSI FITUR DAN HYPERPARAMETER TUNING PADA RANDOM FOREST UNTUK KLASIFIKASI WEB PHISING

Pramasta, Luthfa Sobrian (2024) STUDI PENGARUH SELEKSI FITUR DAN HYPERPARAMETER TUNING PADA RANDOM FOREST UNTUK KLASIFIKASI WEB PHISING. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (766kB)
[img] Text (BAB I)
BAB I.pdf

Download (203kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (351kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (644kB)
[img] Text (BAB V)
BAB V.pdf

Download (69kB)
[img] Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf
Restricted to Registered users only

Download (785kB)
[img] Archive (SOURCE CODE)
Sourcecode - 21.11.3943.zip
Restricted to Repository staff only

Download (900kB)

Abstract

Phishing merupakan upaya ilegal untuk mencuri informasi penting seperti user ID dan kata sandi melalui situs palsu [1]. Laporan APWG mencatat 165.772 situs phishing terdeteksi pada kuartal pertama 2020, dengan rekor 245.771 serangan di Januari 2021, yang mayoritas menargetkan lembaga keuangan [2], [3]. Untuk mencegah ancaman ini, pengembangan model machine learning, seperti Random Forest, digunakan karena akurasinya tinggi dan kemampuannya menangani dataset kompleks. Namun, untuk mengurangi kompleksitas komputasi, seleksi fitur seperti Chi-Square dan RFE diterapkan, serta hyperparameter tuning dengan Bayesian Optimization dilakukan untuk meningkatkan performa model. Penelitian ini menggunakan dataset Phishing Websites dari UCI Machine Learning Repository dengan 31 fitur kategorikal. Langkah-langkah penelitian meliputi prapemrosesan data, seleksi fitur dengan Chi-Square dan RFE, serta tuning hyperparameter menggunakan Bayesian Optimization. Evaluasi dilakukan dengan cross-validation 10 fold untuk mengukur akurasi dan recall. Hasil penelitian menunjukkan kombinasi Chi-Square dan Bayesian Optimization menghasilkan akurasi tertinggi sebesar 97,02% dengan cross-validation 97,29%, lebih baik dibandingkan lainnya. Hal ini membuktikan bahwa Chi-Square efektif untuk seleksi fitur pada data nominal, sedangkan Bayesian Optimization membantu meningkatkan performa model secara efisien. Penelitian ini dapat dimanfaatkan oleh institusi keamanan siber dan lembaga pemerintah untuk mendeteksi situs web phishing dengan lebih andal.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Baita, Anna
Uncontrolled Keywords: Bayesian Optimization, Chi-Square, Phishing, Random Forest, RFE
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 18 Mar 2025 06:19
Last Modified: 18 Mar 2025 06:19
URI: http://eprints.amikom.ac.id/id/eprint/28917

Actions (login required)

View Item View Item