eprintid: 31884 rev_number: 17 eprint_status: archive userid: 12 dir: disk0/00/03/18/84 datestamp: 2026-07-02 04:02:09 lastmod: 2026-07-02 04:02:09 status_changed: 2026-07-02 04:02:09 type: thesis metadata_visibility: show creators_name: Bonai, Georel Jeferson Fransiskus creators_nim: 22.83.0833 contributors_name: Hidayat, Tonny corp_creators: Universitas AMIKOM Yogyakarta title: MULTINOMIAL NAÏVE BAYES UNTUK DETEKSI PHISHING URL DENGAN PERBANDINGAN REPRESENTASI FITUR BAG OF WORDS DAN TF-IDF ispublished: pub subjects: 000.000.000A divisions: tk full_text_status: restricted keywords: Phishing URL, Multinomial Naïve Bayes, Bag of Words, TF-IDF, SMOTE. abstract: Phishing merupakan salah satu bentuk serangan siber yang memanfaatkan URL palsu untuk menipu pengguna agar memberikan informasi sensitif. Seiring meningkatnya jumlah serangan phishing, diperlukan metode deteksi otomatis yang efektif dan efisien. Penelitian ini bertujuan untuk membangun dan mengevaluasi model deteksi phishing URL menggunakan algoritma Multinomial Naïve Bayes dengan dua metode representasi teks, yaitu Bag of Words (BoW) dan Term Frequency–Inverse Document Frequency (TF-IDF). Dataset yang digunakan terdiri dari beberapa kelas URL, yaitu benign, phishing, malware, dan defacement, yang memiliki distribusi data tidak seimbang. Untuk mengatasi permasalahan tersebut, diterapkan teknik Synthetic Minority Over-sampling Technique (SMOTE) pada data latih. Proses penelitian meliputi tahapan preprocessing teks, representasi fitur menggunakan character n-gram, pelatihan model, serta evaluasi menggunakan metrik accuracy, precision, recall, dan F1-score. Selain itu, dilakukan 5-Fold Cross Validation untuk mengukur stabilitas dan kemampuan generalisasi model. Hasil pengujian menunjukkan bahwa kedua metode representasi teks mampu menghasilkan performa klasifikasi yang baik. Representasi BoW menghasilkan accuracy sebesar (78,20%) dan F1-score sebesar (78,59%), sedangkan TF-IDF memperoleh accuracy sebesar (77,90%) dan F1-score sebesar (79,16%). Dari sisi stabilitas, hasil validasi menunjukkan nilai CV-Mean yang konsisten pada kedua metode. Selain itu, BoW memiliki waktu komputasi vektorisasi yang lebih rendah dibandingkan TF-IDF, sehingga lebih efisien dalam pemrosesan data skala besar. Berdasarkan evaluasi kinerja, stabilitas model, dan efisiensi waktu komputasi, model Multinomial Naïve Bayes dengan representasi BoW dan penerapan SMOTE dipilih sebagai model terbaik dalam penelitian ini. date: 2026-01-23 date_type: published institution: Universitas AMIKOM Yogyakarta department: Fakultas Ilmu Komputer thesis_type: bachelor thesis_name: skripsi citation: Bonai, Georel Jeferson Fransiskus (2026) MULTINOMIAL NAÏVE BAYES UNTUK DETEKSI PHISHING URL DENGAN PERBANDINGAN REPRESENTASI FITUR BAG OF WORDS DAN TF-IDF. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta. document_url: https://eprints.amikom.ac.id/id/eprint/31884/1/COVER.pdf document_url: https://eprints.amikom.ac.id/id/eprint/31884/2/BAB%20I.pdf document_url: https://eprints.amikom.ac.id/id/eprint/31884/3/BAB%20II.pdf document_url: https://eprints.amikom.ac.id/id/eprint/31884/4/BAB%20III.pdf document_url: https://eprints.amikom.ac.id/id/eprint/31884/5/BAB%20IV.pdf document_url: https://eprints.amikom.ac.id/id/eprint/31884/6/BAB%20V.pdf document_url: https://eprints.amikom.ac.id/id/eprint/31884/8/Daftar%20Pustaka%20dan%20Lampiran.pdf document_url: https://eprints.amikom.ac.id/id/eprint/31884/9/Sourcecode%20-%2022.83.0833.zip document_url: https://eprints.amikom.ac.id/id/eprint/31884/10/Publikasi.pdf