Susetya, Yohanes Eudes Anjas (2020) IDENTIFIKASI DUPLIKAT PERTANYAAN MENGGUNAKAN METODE GLOBAL VECTOR (GLOVE). S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (848kB) |
|
Text (BAB I)
BAB I.pdf Download (232kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (729kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (194kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (728kB) |
|
Text (BAB V)
BAB V.pdf Download (40kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (147kB) |
|
Archive (SOURCE CODE)
Source Code - 17.11.0922 - Yohanes Eudes Anjas Susetya - Yohanes Eudes Anjas Susetya.zip Restricted to Registered users only Download (14MB) |
|
Text (PUBLIKASI)
Publikasi-17.11.0922-Yohanes Eudes Anjas Susetya - Yohanes Eudes Anjas Susetya.pdf Restricted to Repository staff only Download (685kB) |
Abstract
Forum diskusi online merupakan tempat untuk berkumpul pengguna internet yang di dalamnya kita bisa berbagi informasi dan berdiskusi antar pengguna forum mengenai suatu topik tertentu. Mengingat semakin bertambahnya pengguna internet saat ini juga membuat forum diskusi semakin ramai dan aktif dalam melakukan tanya jawab. Dengan banyaknya pengguna menyebabkan setiap pengguna di dalam forum menanyakan pertanyaan dengan maksud yang sama namun dengan kata yang berbeda. Oleh sebab itu penelitian ini menggunakan data pertanyaan forum tanya jawab untuk melakukan identifikasi duplikat pertanyaan yang diperoleh dari situs web Quora Indonesia. Pada penelitian ini data diklasifikasikan menggunakan Bidirectional Long Short Term Memory atau Bi-LSTM. Pertanyaan yang diidentifikasi akan memiliki 2 label yaitu duplicate dan not_diplicate. Untuk merepresentasikan kata ke dalam vektor, penelitian ini menggunakan word embedding. Penelitian ini bertujuan untuk mengetahui berapa hasil akurasi dari word embedding yang digunakan dalam identifikasi duplikat pasangan pertanyaan menggunakan Bahasa Indonesia. Metode word embedding yang digunakan adalah Global Vector (GloVe). Dari percobaan word embedding metode Global Vector (GloVe) yang dilakukan dengan pembagian data training 80% dan data test 20% dari total jumlah dataset 10000 mendapatkan hasil akurasi 95% dengan presisi 96%, recall 93% dan f1-score 94%.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Quora, Identifikasi Pertanyaan, Word Embedding, GloVe, Bi-LSTM | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data | ||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 24 Jun 2022 03:28 | ||
Last Modified: | 16 Aug 2023 03:20 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/2464 |
Actions (login required)
View Item |