Pratama, Rangga Teddy (2023) PERBANDINGAN ALGORITMA RANDOM FOREST DAN LOGISTIC REGRESSION DENGAN SELEKSI FITUR INFORMATION GAIN UNTUK KLASIFIKASI EMAIL SPAM. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (742kB) |
|
Text (BAB I)
BAB I.pdf Download (191kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (729kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (237kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (754kB) |
|
Text (BAB V)
BAB V.pdf Download (59kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (133kB) |
|
Archive (SOURCE CODE)
Source Code - Rangga Teddy Pratama.zip Restricted to Repository staff only Download (611kB) |
|
Text (PUBLIKASI)
Publikasi.pdf Restricted to Repository staff only Download (585kB) |
Abstract
Email merupakan surat elektronik yang memungkinkan seseorang mengirimkan dan menerima pesan lebih dari satu orang. Email memiliki kelebihan diantara lain cepat, hemat, dan dapat mengirimkan pesan dalam bentuk dolumen, excel, foto, audio, video, dll sehingga banyak yang menggunakannya diseluruh dunia. Banyaknya lalulintas email setiap harinya ini sering disalahgunakan oleh berbagai pihak untuk mengirim informasi iklan produk jasa dan berbagai informasinya yang tidak berguna atau tidak diinginkan oleh user. Itulah yang sering disebut dengan email SPAM. Untuk penyaringan email SPAM digunakan banyak algoritma klasifikasi, algoritma tersebut diantarannya adalah random forest dan logistic regression. Pada penelitian ini akan dilakukan perbandingan algoritma random forest dan logistic regression. Untuk meningkatkan kinerja algoritma klasifikasi dilakukan seleksi fitur menggunakan metode information gain yang bertujuan untuk menyeleksi fitur/atribut yang paling berpengaruh. Berdasarkan hasil pengujian yang menggunakan data sebanyak 4601 baris data dan 58 fitur, menggunakan algoritma random forest dan logistic regression diperoleh hasil akurasi sebesar 95,3% dan 82,9%, setelah dilakukan seleksi fitur dengan information gain akurasi yang dihasilkan sebesar 95,6% dan 82,3%. Dari uji coba terjadi peningkata akurasi pada random forest dan terjadi penurunan pada logistic regression. Hal ini membuktikan bahwa penerapan seleksi fitur information gain dapat menghilangkan atribut redundan.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Email SPAM, Klasifikasi, Random forest, Logistic regression, Information gain | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer | ||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 01 Nov 2023 03:09 | ||
Last Modified: | 01 Nov 2023 03:09 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/22370 |
Actions (login required)
View Item |