<mods:mods version="3.3" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-3.xsd" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"><mods:titleInfo><mods:title>MULTINOMIAL NAÏVE BAYES UNTUK DETEKSI PHISHING&#13;
URL DENGAN PERBANDINGAN REPRESENTASI FITUR&#13;
BAG OF WORDS DAN TF-IDF</mods:title></mods:titleInfo><mods:name type="personal"><mods:namePart type="given">Georel Jeferson Fransiskus</mods:namePart><mods:namePart type="family">Bonai</mods:namePart><mods:role><mods:roleTerm type="text">author</mods:roleTerm></mods:role></mods:name><mods:abstract>Phishing merupakan salah satu bentuk serangan siber yang memanfaatkan&#13;
URL palsu untuk menipu pengguna agar memberikan informasi sensitif. Seiring&#13;
meningkatnya jumlah serangan phishing, diperlukan metode deteksi otomatis yang&#13;
efektif dan efisien. Penelitian ini bertujuan untuk membangun dan mengevaluasi&#13;
model deteksi phishing URL menggunakan algoritma Multinomial Naïve Bayes&#13;
dengan dua metode representasi teks, yaitu Bag of Words (BoW) dan Term&#13;
Frequency–Inverse Document Frequency (TF-IDF).&#13;
Dataset yang digunakan terdiri dari beberapa kelas URL, yaitu benign,&#13;
phishing, malware, dan defacement, yang memiliki distribusi data tidak seimbang.&#13;
Untuk mengatasi permasalahan tersebut, diterapkan teknik Synthetic Minority&#13;
Over-sampling Technique (SMOTE) pada data latih. Proses penelitian meliputi&#13;
tahapan preprocessing teks, representasi fitur menggunakan character n-gram,&#13;
pelatihan model, serta evaluasi menggunakan metrik accuracy, precision, recall,&#13;
dan F1-score. Selain itu, dilakukan 5-Fold Cross Validation untuk mengukur&#13;
stabilitas dan kemampuan generalisasi model.&#13;
Hasil pengujian menunjukkan bahwa kedua metode representasi teks&#13;
mampu menghasilkan performa klasifikasi yang baik. Representasi BoW&#13;
menghasilkan accuracy sebesar (78,20%) dan F1-score sebesar (78,59%),&#13;
sedangkan TF-IDF memperoleh accuracy sebesar (77,90%) dan F1-score sebesar&#13;
(79,16%). Dari sisi stabilitas, hasil validasi menunjukkan nilai CV-Mean yang&#13;
konsisten pada kedua metode. Selain itu, BoW memiliki waktu komputasi&#13;
vektorisasi yang lebih rendah dibandingkan TF-IDF, sehingga lebih efisien dalam&#13;
pemrosesan data skala besar. Berdasarkan evaluasi kinerja, stabilitas model, dan&#13;
efisiensi waktu komputasi, model Multinomial Naïve Bayes dengan representasi&#13;
BoW dan penerapan SMOTE dipilih sebagai model terbaik dalam penelitian ini.</mods:abstract><mods:classification authority="lcc">000 Ilmu komputer, informasi dan pekerjaan umum</mods:classification><mods:originInfo><mods:dateIssued encoding="iso8061">2026-01-23</mods:dateIssued></mods:originInfo><mods:originInfo><mods:publisher>Universitas AMIKOM Yogyakarta;Fakultas Ilmu Komputer</mods:publisher></mods:originInfo><mods:genre>Thesis</mods:genre></mods:mods>