PERBANDINGAN KOMBINASI MODEL ALGORITMA NAIVE BAYES DENGAN TEKNIK PEMBOBOTAN KATA DALAM ANALISIS SENTIMEN

-, Muttafi’ah (2021) PERBANDINGAN KOMBINASI MODEL ALGORITMA NAIVE BAYES DENGAN TEKNIK PEMBOBOTAN KATA DALAM ANALISIS SENTIMEN. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (1MB)
[img] Text (BAB I)
BAB I.pdf

Download (351kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (977kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (976kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (490kB)
[img] Text (BAB V)
BAB V.pdf

Download (71kB)
[img] Text (DAFTAR PUSTAKA - LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf
Restricted to Registered users only

Download (229kB)
[img] Other (SOURCE CODE)
Source Code-17.11.1236-Muttafiah - Muttafiah.rar
Restricted to Repository staff only

Download (120MB)
[img] Text (PUBLIKASI)
Publikasi-17.11.1236-Muttafiah - Muttafiah.pdf
Restricted to Repository staff only

Download (801kB)

Abstract

Text mining merupakan konsep dasar analisis sentimen dan disiplin ilmu yang menggabungkan ilmu bahasa dan ilmu komputer dengan teknik pembelajaran mesin (machine leaning). Text mining digunakan untuk mengubah teks menjadi lebih terstruktur. Sedangkan pembelajaran mesin berfokus untuk mencari dan mengembangkan algoritma untuk membangun sebuah sistem yang dapat mensimulasikan atau meniru sebuah pola dari kumpulan data. Dalam penelitian ini menggunakan teknik supervised learning yang merupakan teknik dasar pembelajaran mesin dengan mengkomparasikan model algoritma Naive Bayes Classifier yaitu Multinomial Naive Bayes dan Bernoulli Naive Bayes dengan objek sentimen dari Twitter. Pada penelitian ini juga menggunakan teknik pembobotan kata yaitu TF-IDF dan TF- RF pada masing – masing model. Penelitian ini dilakukan untuk mengetahui kombinasi terbaik dari setiap model dengan pembobotan kata. Tahap awal dalam penelitian ini adalah crawling data menggunakan API Twitter, kemudian data tersebut dilabeling. Setelah data diberi label, data tersebut akan masuk ke tahap penting dalam penelitian, yaitu preprocessing dan pembobotan kata. Data yang telah dilabeli dibersihkan dan diubah menjadi data yang terstruktrur sehingga data siap untuk dianalisis. Data hasil prepocessing diberi bobot dengan teknik TF-IDF dan TF-RF, kemudian diklasifikasi satu-persatu menggunakan 2 model NBC sehingga dalam penelitian ini terdapat 4 skema model, yaitu Multinomial dan TF-IDF, Bernoulli dan TF-IDF, Multinomial dan TF-RF serta Bernoulli dan TF-RF. Tahap terakhir dari penelitian ini adalah pengujian menggunakan Confusion Matrix kemudian divalidasi dengan K-Fold Cross Validation, pengujian dilakukan untuk melihat performa terbaik dari 4 skema tersebut. Dari 4 skema yang dilakukan, skema TF-IDF dan TF-RF dengan Bernoulli Naive Bayes dari hasil pengujian Confusion Matrix mengahasilkan akurasi terbaik yaitu 61%, dan rata - rata nilai akurasi dari validasi 5-fold sebesar 60%. Dan yang memiliki nilai akurasi terendah terletak pada model Multinomial Naive Bayes dan TF-IDF yaitu 58% dari Confusion Matrix, dengan rata-rata nilai akurasi 59% dari validasi 5-fold.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Kharisma, Rizqi Sukma
Uncontrolled Keywords: Multinomial Naïve Bayes, Bernoulli Naïve Bayes, TF-IDF, TF-RF, Analisis sentimen
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 20 Jun 2022 03:03
Last Modified: 14 Aug 2023 03:50
URI: http://eprints.amikom.ac.id/id/eprint/1726

Actions (login required)

View Item View Item