-, Muttafi’ah (2021) PERBANDINGAN KOMBINASI MODEL ALGORITMA NAIVE BAYES DENGAN TEKNIK PEMBOBOTAN KATA DALAM ANALISIS SENTIMEN. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (1MB) |
|
Text (BAB I)
BAB I.pdf Download (351kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (977kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (976kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (490kB) |
|
Text (BAB V)
BAB V.pdf Download (71kB) |
|
Text (DAFTAR PUSTAKA - LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf Restricted to Registered users only Download (229kB) |
|
Other (SOURCE CODE)
Source Code-17.11.1236-Muttafiah - Muttafiah.rar Restricted to Repository staff only Download (120MB) |
|
Text (PUBLIKASI)
Publikasi-17.11.1236-Muttafiah - Muttafiah.pdf Restricted to Repository staff only Download (801kB) |
Abstract
Text mining merupakan konsep dasar analisis sentimen dan disiplin ilmu yang menggabungkan ilmu bahasa dan ilmu komputer dengan teknik pembelajaran mesin (machine leaning). Text mining digunakan untuk mengubah teks menjadi lebih terstruktur. Sedangkan pembelajaran mesin berfokus untuk mencari dan mengembangkan algoritma untuk membangun sebuah sistem yang dapat mensimulasikan atau meniru sebuah pola dari kumpulan data. Dalam penelitian ini menggunakan teknik supervised learning yang merupakan teknik dasar pembelajaran mesin dengan mengkomparasikan model algoritma Naive Bayes Classifier yaitu Multinomial Naive Bayes dan Bernoulli Naive Bayes dengan objek sentimen dari Twitter. Pada penelitian ini juga menggunakan teknik pembobotan kata yaitu TF-IDF dan TF- RF pada masing – masing model. Penelitian ini dilakukan untuk mengetahui kombinasi terbaik dari setiap model dengan pembobotan kata. Tahap awal dalam penelitian ini adalah crawling data menggunakan API Twitter, kemudian data tersebut dilabeling. Setelah data diberi label, data tersebut akan masuk ke tahap penting dalam penelitian, yaitu preprocessing dan pembobotan kata. Data yang telah dilabeli dibersihkan dan diubah menjadi data yang terstruktrur sehingga data siap untuk dianalisis. Data hasil prepocessing diberi bobot dengan teknik TF-IDF dan TF-RF, kemudian diklasifikasi satu-persatu menggunakan 2 model NBC sehingga dalam penelitian ini terdapat 4 skema model, yaitu Multinomial dan TF-IDF, Bernoulli dan TF-IDF, Multinomial dan TF-RF serta Bernoulli dan TF-RF. Tahap terakhir dari penelitian ini adalah pengujian menggunakan Confusion Matrix kemudian divalidasi dengan K-Fold Cross Validation, pengujian dilakukan untuk melihat performa terbaik dari 4 skema tersebut. Dari 4 skema yang dilakukan, skema TF-IDF dan TF-RF dengan Bernoulli Naive Bayes dari hasil pengujian Confusion Matrix mengahasilkan akurasi terbaik yaitu 61%, dan rata - rata nilai akurasi dari validasi 5-fold sebesar 60%. Dan yang memiliki nilai akurasi terendah terletak pada model Multinomial Naive Bayes dan TF-IDF yaitu 58% dari Confusion Matrix, dengan rata-rata nilai akurasi 59% dari validasi 5-fold.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Multinomial Naïve Bayes, Bernoulli Naïve Bayes, TF-IDF, TF-RF, Analisis sentimen | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer |
||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 20 Jun 2022 03:03 | ||
Last Modified: | 14 Aug 2023 03:50 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/1726 |
Actions (login required)
View Item |