ANALISIS KOMPARATIF ALGORITMA MACHINE LEARNING UNTUK DETEKSI EMAIL SPAM

Asghar, Husein Ali (2023) ANALISIS KOMPARATIF ALGORITMA MACHINE LEARNING UNTUK DETEKSI EMAIL SPAM. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (3MB)
[img] Text (BAB I)
BAB I.pdf

Download (310kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (540kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB V)
BAB V.pdf

Download (94kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (309kB)
[img] Archive (SOURCE CODE)
Sourcecode - Husein Ali Asghar.zip
Restricted to Repository staff only

Download (63MB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (641kB)

Abstract

Penelitian ini bertujuan membandingkan metode klasifikasi untuk mengidentifikasi surel spam dan gambar spam dengan menggunakan ekstraksi fitur N-gram. Algoritma machine learning yang digunakan adalah Multinomial Naïve Bayes, Random Forest, dan Support Vector Machine. Untuk gambar spam, digunakan metode Optical Character Recognition dengan library Python, pyteserract. Data yang digunakan berasal dari sumber terbuka Kaggle untuk surel spam dan Spam Hunter untuk gambar spam.Hasil penelitian menunjukkan bahwa algoritma Random Forest memiliki kinerja terbaik dalam mendeteksi surel spam, dengan akurasi mencapai 0,99 dan nilai MCC 0,999. Sementara itu, dalam mendeteksi gambar spam, algoritma Support Vector Machine dan Multinomial Naïve Bayes memiliki kinerja yang setara, dengan akurasi 0,98 dan nilai MCC 0,976. Metode ekstraksi fitur Ngram terbaik adalah menggunakan 1-gram.Dalam kesimpulan, algoritma Random Forest dengan ekstraksi fitur 1gram adalah yang terbaik untuk mendeteksi surel spam, sedangkan Multinomial Naïve Bayes dan Support Vector Machine dengan ekstraksi fitur 1-gram adalah yang terbaik untuk mendeteksi gambar spam

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Santoso, Banu
Uncontrolled Keywords: N-gram, Random Forest, Support Vector Machine, Multinomial Naïve Bayes, Deteksi Spam
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
Divisions: Fakultas Ilmu Komputer > Teknik Komputer
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 06 Nov 2023 03:43
Last Modified: 06 Nov 2023 03:44
URI: http://eprints.amikom.ac.id/id/eprint/22683

Actions (login required)

View Item View Item