PENERAPAN TEXT MINING DALAM KLASIFIKASI JUDUL SKRIPSI MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER

Amiyantoro, Cakra (2018) PENERAPAN TEXT MINING DALAM KLASIFIKASI JUDUL SKRIPSI MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER-ABSTRAK.pdf

Download (3MB)
[img] Text (BAB I)
BAB I.pdf

Download (1MB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (4MB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (9MB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (8MB)
[img] Text (BAB V)
BAB V.pdf

Download (450kB)
[img] Text (DAFTAR PUSTAKA)
DAFTAR PUSTAKA.pdf
Restricted to Registered users only

Download (644kB)

Abstract

Di perpustakaan perguruan tinggi, dokumen skripsi diklasifikasikan. Umumnya pengklasifikasian dokumen tersebut menggunakan standar DDC (Dewey Decimal Classification). Dengan menggunakan konsep text mining, proses klasifikasi dapat dilakukan dengan komputerisasi, menghemat waktu usaha dan pemikiran. Penelitian ini menerapkan term weighting tf-idf dan menggunakan metode klasifikasi Naive Bayes Classifier. Penelitian ini menggunakan data sampel yang diambil dari https:/simpus.uii.ac.id Ada 4 kelas dengan masing-masing 300 data. Evaluasi penelitian menggunakan metode Confusion Matrix dengan 14 skenario preprocessing. Skenario ini dibedakan berdasarkan bentuk pemecahan unigram, bigram, trigram, berserta kombinasinya, dan ada atau tidaknya proses stemming. Penelitian ini menghasilkan akurasi terbaik dalan menyelesaikan kata menggunakan unigram, bigram, trigam secara bersanaan dan tanpa stemming, dengan akurasi 97,92%. Penggunaan kombinasi pemecahan kata meningkatkan akurasi model Klasifikasi Naive Bayes yang diimplementasikan dalam penelitian ini. Stemming akan bekerja lebih baik dalam skenario yang tidak melibatkan pemecahan unigram. Akurasi akan meningkat dengan menerapkan stemming dalam skenario pemecahan bigram dan trigram.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Sunyoto, Andi
Uncontrolled Keywords: text mining, classification, n-gram, tf-idf, naive bayes classifier, confusion matrix.
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 28 Dec 2023 04:48
Last Modified: 19 Jul 2024 02:43
URI: http://eprints.amikom.ac.id/id/eprint/23145

Actions (login required)

View Item View Item