Pramasta, Luthfa Sobrian (2024) STUDI PENGARUH SELEKSI FITUR DAN HYPERPARAMETER TUNING PADA RANDOM FOREST UNTUK KLASIFIKASI WEB PHISING. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
![]() |
Text (COVER-ABSTRAK)
COVER.pdf Download (766kB) |
![]() |
Text (BAB I)
BAB I.pdf Download (203kB) |
![]() |
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (1MB) |
![]() |
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (351kB) |
![]() |
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (644kB) |
![]() |
Text (BAB V)
BAB V.pdf Download (69kB) |
![]() |
Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf Restricted to Registered users only Download (785kB) |
![]() |
Archive (SOURCE CODE)
Sourcecode - 21.11.3943.zip Restricted to Repository staff only Download (900kB) |
Abstract
Phishing merupakan upaya ilegal untuk mencuri informasi penting seperti user ID dan kata sandi melalui situs palsu [1]. Laporan APWG mencatat 165.772 situs phishing terdeteksi pada kuartal pertama 2020, dengan rekor 245.771 serangan di Januari 2021, yang mayoritas menargetkan lembaga keuangan [2], [3]. Untuk mencegah ancaman ini, pengembangan model machine learning, seperti Random Forest, digunakan karena akurasinya tinggi dan kemampuannya menangani dataset kompleks. Namun, untuk mengurangi kompleksitas komputasi, seleksi fitur seperti Chi-Square dan RFE diterapkan, serta hyperparameter tuning dengan Bayesian Optimization dilakukan untuk meningkatkan performa model. Penelitian ini menggunakan dataset Phishing Websites dari UCI Machine Learning Repository dengan 31 fitur kategorikal. Langkah-langkah penelitian meliputi prapemrosesan data, seleksi fitur dengan Chi-Square dan RFE, serta tuning hyperparameter menggunakan Bayesian Optimization. Evaluasi dilakukan dengan cross-validation 10 fold untuk mengukur akurasi dan recall. Hasil penelitian menunjukkan kombinasi Chi-Square dan Bayesian Optimization menghasilkan akurasi tertinggi sebesar 97,02% dengan cross-validation 97,29%, lebih baik dibandingkan lainnya. Hal ini membuktikan bahwa Chi-Square efektif untuk seleksi fitur pada data nominal, sedangkan Bayesian Optimization membantu meningkatkan performa model secara efisien. Penelitian ini dapat dimanfaatkan oleh institusi keamanan siber dan lembaga pemerintah untuk mendeteksi situs web phishing dengan lebih andal.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Bayesian Optimization, Chi-Square, Phishing, Random Forest, RFE | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data |
||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 18 Mar 2025 06:19 | ||
Last Modified: | 18 Mar 2025 06:19 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/28917 |
Actions (login required)
![]() |
View Item |