eprintid: 31884
rev_number: 17
eprint_status: archive
userid: 12
dir: disk0/00/03/18/84
datestamp: 2026-07-02 04:02:09
lastmod: 2026-07-02 04:02:09
status_changed: 2026-07-02 04:02:09
type: thesis
metadata_visibility: show
creators_name: Bonai, Georel Jeferson Fransiskus
creators_nim: 22.83.0833
contributors_name: Hidayat, Tonny
corp_creators: Universitas AMIKOM Yogyakarta
title: MULTINOMIAL NAÏVE BAYES UNTUK DETEKSI PHISHING
URL DENGAN PERBANDINGAN REPRESENTASI FITUR
BAG OF WORDS DAN TF-IDF
ispublished: pub
subjects: 000.000.000A
divisions: tk
full_text_status: restricted
keywords: Phishing URL, Multinomial Naïve Bayes, Bag of Words, TF-IDF,
SMOTE.
abstract: Phishing merupakan salah satu bentuk serangan siber yang memanfaatkan
URL palsu untuk menipu pengguna agar memberikan informasi sensitif. Seiring
meningkatnya jumlah serangan phishing, diperlukan metode deteksi otomatis yang
efektif dan efisien. Penelitian ini bertujuan untuk membangun dan mengevaluasi
model deteksi phishing URL menggunakan algoritma Multinomial Naïve Bayes
dengan dua metode representasi teks, yaitu Bag of Words (BoW) dan Term
Frequency–Inverse Document Frequency (TF-IDF).
Dataset yang digunakan terdiri dari beberapa kelas URL, yaitu benign,
phishing, malware, dan defacement, yang memiliki distribusi data tidak seimbang.
Untuk mengatasi permasalahan tersebut, diterapkan teknik Synthetic Minority
Over-sampling Technique (SMOTE) pada data latih. Proses penelitian meliputi
tahapan preprocessing teks, representasi fitur menggunakan character n-gram,
pelatihan model, serta evaluasi menggunakan metrik accuracy, precision, recall,
dan F1-score. Selain itu, dilakukan 5-Fold Cross Validation untuk mengukur
stabilitas dan kemampuan generalisasi model.
Hasil pengujian menunjukkan bahwa kedua metode representasi teks
mampu menghasilkan performa klasifikasi yang baik. Representasi BoW
menghasilkan accuracy sebesar (78,20%) dan F1-score sebesar (78,59%),
sedangkan TF-IDF memperoleh accuracy sebesar (77,90%) dan F1-score sebesar
(79,16%). Dari sisi stabilitas, hasil validasi menunjukkan nilai CV-Mean yang
konsisten pada kedua metode. Selain itu, BoW memiliki waktu komputasi
vektorisasi yang lebih rendah dibandingkan TF-IDF, sehingga lebih efisien dalam
pemrosesan data skala besar. Berdasarkan evaluasi kinerja, stabilitas model, dan
efisiensi waktu komputasi, model Multinomial Naïve Bayes dengan representasi
BoW dan penerapan SMOTE dipilih sebagai model terbaik dalam penelitian ini.
date: 2026-01-23
date_type: published
institution: Universitas AMIKOM Yogyakarta
department: Fakultas Ilmu Komputer
thesis_type: bachelor
thesis_name: skripsi
citation:   Bonai, Georel Jeferson Fransiskus  (2026) MULTINOMIAL NAÏVE BAYES UNTUK DETEKSI PHISHING URL DENGAN PERBANDINGAN REPRESENTASI FITUR BAG OF WORDS DAN TF-IDF.  S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.   
document_url: https://eprints.amikom.ac.id/id/eprint/31884/1/COVER.pdf
document_url: https://eprints.amikom.ac.id/id/eprint/31884/2/BAB%20I.pdf
document_url: https://eprints.amikom.ac.id/id/eprint/31884/3/BAB%20II.pdf
document_url: https://eprints.amikom.ac.id/id/eprint/31884/4/BAB%20III.pdf
document_url: https://eprints.amikom.ac.id/id/eprint/31884/5/BAB%20IV.pdf
document_url: https://eprints.amikom.ac.id/id/eprint/31884/6/BAB%20V.pdf
document_url: https://eprints.amikom.ac.id/id/eprint/31884/8/Daftar%20Pustaka%20dan%20Lampiran.pdf
document_url: https://eprints.amikom.ac.id/id/eprint/31884/9/Sourcecode%20-%2022.83.0833.zip
document_url: https://eprints.amikom.ac.id/id/eprint/31884/10/Publikasi.pdf