Asghar, Husein Ali (2023) ANALISIS KOMPARATIF ALGORITMA MACHINE LEARNING UNTUK DETEKSI EMAIL SPAM. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (3MB) |
|
Text (BAB I)
BAB I.pdf Download (310kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (1MB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (540kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (1MB) |
|
Text (BAB V)
BAB V.pdf Download (94kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (309kB) |
|
Archive (SOURCE CODE)
Sourcecode - Husein Ali Asghar.zip Restricted to Repository staff only Download (63MB) |
|
Text (PUBLIKASI)
Publikasi.pdf Restricted to Repository staff only Download (641kB) |
Abstract
Penelitian ini bertujuan membandingkan metode klasifikasi untuk mengidentifikasi surel spam dan gambar spam dengan menggunakan ekstraksi fitur N-gram. Algoritma machine learning yang digunakan adalah Multinomial Naïve Bayes, Random Forest, dan Support Vector Machine. Untuk gambar spam, digunakan metode Optical Character Recognition dengan library Python, pyteserract. Data yang digunakan berasal dari sumber terbuka Kaggle untuk surel spam dan Spam Hunter untuk gambar spam.Hasil penelitian menunjukkan bahwa algoritma Random Forest memiliki kinerja terbaik dalam mendeteksi surel spam, dengan akurasi mencapai 0,99 dan nilai MCC 0,999. Sementara itu, dalam mendeteksi gambar spam, algoritma Support Vector Machine dan Multinomial Naïve Bayes memiliki kinerja yang setara, dengan akurasi 0,98 dan nilai MCC 0,976. Metode ekstraksi fitur Ngram terbaik adalah menggunakan 1-gram.Dalam kesimpulan, algoritma Random Forest dengan ekstraksi fitur 1gram adalah yang terbaik untuk mendeteksi surel spam, sedangkan Multinomial Naïve Bayes dan Support Vector Machine dengan ekstraksi fitur 1-gram adalah yang terbaik untuk mendeteksi gambar spam
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | N-gram, Random Forest, Support Vector Machine, Multinomial Naïve Bayes, Deteksi Spam | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer | ||
Divisions: | Fakultas Ilmu Komputer > Teknik Komputer | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 06 Nov 2023 03:43 | ||
Last Modified: | 06 Nov 2023 03:44 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/22683 |
Actions (login required)
View Item |