relation: https://eprints.amikom.ac.id/id/eprint/31884/ title: MULTINOMIAL NAÏVE BAYES UNTUK DETEKSI PHISHING URL DENGAN PERBANDINGAN REPRESENTASI FITUR BAG OF WORDS DAN TF-IDF creator: Bonai, Georel Jeferson Fransiskus subject: 000 Ilmu komputer, informasi dan pekerjaan umum description: Phishing merupakan salah satu bentuk serangan siber yang memanfaatkan URL palsu untuk menipu pengguna agar memberikan informasi sensitif. Seiring meningkatnya jumlah serangan phishing, diperlukan metode deteksi otomatis yang efektif dan efisien. Penelitian ini bertujuan untuk membangun dan mengevaluasi model deteksi phishing URL menggunakan algoritma Multinomial Naïve Bayes dengan dua metode representasi teks, yaitu Bag of Words (BoW) dan Term Frequency–Inverse Document Frequency (TF-IDF). Dataset yang digunakan terdiri dari beberapa kelas URL, yaitu benign, phishing, malware, dan defacement, yang memiliki distribusi data tidak seimbang. Untuk mengatasi permasalahan tersebut, diterapkan teknik Synthetic Minority Over-sampling Technique (SMOTE) pada data latih. Proses penelitian meliputi tahapan preprocessing teks, representasi fitur menggunakan character n-gram, pelatihan model, serta evaluasi menggunakan metrik accuracy, precision, recall, dan F1-score. Selain itu, dilakukan 5-Fold Cross Validation untuk mengukur stabilitas dan kemampuan generalisasi model. Hasil pengujian menunjukkan bahwa kedua metode representasi teks mampu menghasilkan performa klasifikasi yang baik. Representasi BoW menghasilkan accuracy sebesar (78,20%) dan F1-score sebesar (78,59%), sedangkan TF-IDF memperoleh accuracy sebesar (77,90%) dan F1-score sebesar (79,16%). Dari sisi stabilitas, hasil validasi menunjukkan nilai CV-Mean yang konsisten pada kedua metode. Selain itu, BoW memiliki waktu komputasi vektorisasi yang lebih rendah dibandingkan TF-IDF, sehingga lebih efisien dalam pemrosesan data skala besar. Berdasarkan evaluasi kinerja, stabilitas model, dan efisiensi waktu komputasi, model Multinomial Naïve Bayes dengan representasi BoW dan penerapan SMOTE dipilih sebagai model terbaik dalam penelitian ini. date: 2026-01-23 type: Thesis type: NonPeerReviewed format: text language: id identifier: https://eprints.amikom.ac.id/id/eprint/31884/1/COVER.pdf format: text language: id identifier: https://eprints.amikom.ac.id/id/eprint/31884/2/BAB%20I.pdf format: text language: id identifier: https://eprints.amikom.ac.id/id/eprint/31884/3/BAB%20II.pdf format: text language: id identifier: https://eprints.amikom.ac.id/id/eprint/31884/4/BAB%20III.pdf format: text language: id identifier: https://eprints.amikom.ac.id/id/eprint/31884/5/BAB%20IV.pdf format: text language: id identifier: https://eprints.amikom.ac.id/id/eprint/31884/6/BAB%20V.pdf format: text language: id identifier: https://eprints.amikom.ac.id/id/eprint/31884/8/Daftar%20Pustaka%20dan%20Lampiran.pdf format: archive language: id identifier: https://eprints.amikom.ac.id/id/eprint/31884/9/Sourcecode%20-%2022.83.0833.zip format: text language: id identifier: https://eprints.amikom.ac.id/id/eprint/31884/10/Publikasi.pdf identifier: Bonai, Georel Jeferson Fransiskus (2026) MULTINOMIAL NAÏVE BAYES UNTUK DETEKSI PHISHING URL DENGAN PERBANDINGAN REPRESENTASI FITUR BAG OF WORDS DAN TF-IDF. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.