Presina, Martha (2021) PERBANDINGAN PERFORMA KERNEL PADA ALGORITMA SUPPORT VECTOR MACHINE DAN TERM FREQUENCY TERHADAP ANALISIS SENTIMEN. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (441kB) |
|
Text (BAB I)
BAB I.pdf Download (324kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (1MB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (978kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (516kB) |
|
Text (BAB V)
BAB V.pdf Download (66kB) |
|
Text (DAFTAR PUSTAKA - LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf Restricted to Registered users only Download (349kB) |
|
Other (SOURCE CODE)
Source Code-17.11.1200-Martha Presina - Martha Presina.rar Restricted to Repository staff only Download (126MB) |
|
Text (PUBLIKASI)
Publikasi-17.11.1200-Martha Presina - Martha Presina.pdf Restricted to Repository staff only Download (454kB) |
Abstract
Konsep dasar dalam analisis sentimen adalah text mining, dimana data teks yang tidak terstruktur harus diubah menjadi data semi terstruktur agar dapat ditemukan pola pada suatu dokumen. Proses pengubahan data teks menjadi data semi terstruktur tersebut merupakan tahap text preprocessing. Tahapan yang penting dalam text preprocessing yaitu term weighting (pembobotan kata). Metode yang sering digunakan untuk melakukan pembobotan kata terhadap suatu dokumen yaitu Term Frequency-Inverse Document Frequency (TF-IDF) dan Term Frequency-Relevance Frequency (TF-RF). Selain itu pada tahap klasifikasi terdapat metode yang populer digunakan untuk analisis sentimen yaitu Support Vector Machine (SVM) dengan beberapa jenis kernelnya. Kernel SVM yang mampu menghasilkan performa terbaik diantaranya Polynomial dan Radial Basis Function (RBF). Sehingga dapat dianalisis untuk mendapatkan kombinasi terbaik antara metode pembobotan kata dan kernel SVM. Langkah awal yang dilakukan yaitu crawling data menggunakan twitter API, data yang berhasil dikumpulkan diberikan label terlebih dahulu menggunakan library dari python. Setelah itu melakukan preprocessing terhadap data, data yang telah bersih akan dilakukan pembobotan kata menggunakan metode TF-IDF dan TF-RF sehingga terdapat 2 dokumen yang berbeda untuk diklasifikasi. Langkah terakhir yaitu melakukan klasifikasi menggunakan kernel SVM yaitu Polynomial dan RBF, dimana tiap kernel tersebut diaplikasikan ke dalam tiap dokumen TF-IDF dan TF-RF, sehingga akan terbentuk 4 skema berbeda. Untuk pengujian performa digunakan metode confusion matrix dan K-Fold Cross Validation. Dari hasil pengujian yang dilakukan, skema TF-RF & RBF menghasilkan performa terbaik dibanding dengan skema lainnya yaitu akurasi ratarata sebesar 73%. Sedangkan skema yang memperoleh performa paling rendah yaitu TF-IDF & Polynomial sebesar 64%.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Kernel Polynomial SVM, Kernel Radial Basis Function SVM, TFIDF, TF-RF, Analisis sentimen | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 003 Sistem-sistem 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer |
||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 18 Jun 2022 04:12 | ||
Last Modified: | 14 Aug 2023 02:00 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/1640 |
Actions (login required)
View Item |