PERBANDINGAN ALGORITMA RANDOM FOREST DAN LOGISTIC REGRESSION DENGAN SELEKSI FITUR INFORMATION GAIN UNTUK KLASIFIKASI EMAIL SPAM

Pratama, Rangga Teddy (2023) PERBANDINGAN ALGORITMA RANDOM FOREST DAN LOGISTIC REGRESSION DENGAN SELEKSI FITUR INFORMATION GAIN UNTUK KLASIFIKASI EMAIL SPAM. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (742kB)
[img] Text (BAB I)
BAB I.pdf

Download (191kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (729kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (237kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (754kB)
[img] Text (BAB V)
BAB V.pdf

Download (59kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (133kB)
[img] Archive (SOURCE CODE)
Source Code - Rangga Teddy Pratama.zip
Restricted to Repository staff only

Download (611kB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (585kB)

Abstract

Email merupakan surat elektronik yang memungkinkan seseorang mengirimkan dan menerima pesan lebih dari satu orang. Email memiliki kelebihan diantara lain cepat, hemat, dan dapat mengirimkan pesan dalam bentuk dolumen, excel, foto, audio, video, dll sehingga banyak yang menggunakannya diseluruh dunia. Banyaknya lalulintas email setiap harinya ini sering disalahgunakan oleh berbagai pihak untuk mengirim informasi iklan produk jasa dan berbagai informasinya yang tidak berguna atau tidak diinginkan oleh user. Itulah yang sering disebut dengan email SPAM. Untuk penyaringan email SPAM digunakan banyak algoritma klasifikasi, algoritma tersebut diantarannya adalah random forest dan logistic regression. Pada penelitian ini akan dilakukan perbandingan algoritma random forest dan logistic regression. Untuk meningkatkan kinerja algoritma klasifikasi dilakukan seleksi fitur menggunakan metode information gain yang bertujuan untuk menyeleksi fitur/atribut yang paling berpengaruh. Berdasarkan hasil pengujian yang menggunakan data sebanyak 4601 baris data dan 58 fitur, menggunakan algoritma random forest dan logistic regression diperoleh hasil akurasi sebesar 95,3% dan 82,9%, setelah dilakukan seleksi fitur dengan information gain akurasi yang dihasilkan sebesar 95,6% dan 82,3%. Dari uji coba terjadi peningkata akurasi pada random forest dan terjadi penurunan pada logistic regression. Hal ini membuktikan bahwa penerapan seleksi fitur information gain dapat menghilangkan atribut redundan.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Lukman, Lukman
Uncontrolled Keywords: Email SPAM, Klasifikasi, Random forest, Logistic regression, Information gain
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 01 Nov 2023 03:09
Last Modified: 01 Nov 2023 03:09
URI: http://eprints.amikom.ac.id/id/eprint/22370

Actions (login required)

View Item View Item