IDENTIFIKASI DUPLIKAT PERTANYAAN MENGGUNAKAN METODE GLOBAL VECTOR (GLOVE)

Susetya, Yohanes Eudes Anjas (2020) IDENTIFIKASI DUPLIKAT PERTANYAAN MENGGUNAKAN METODE GLOBAL VECTOR (GLOVE). S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (848kB)
[img] Text (BAB I)
BAB I.pdf

Download (232kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (729kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (194kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (728kB)
[img] Text (BAB V)
BAB V.pdf

Download (40kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (147kB)
[img] Archive (SOURCE CODE)
Source Code - 17.11.0922 - Yohanes Eudes Anjas Susetya - Yohanes Eudes Anjas Susetya.zip
Restricted to Registered users only

Download (14MB)
[img] Text (PUBLIKASI)
Publikasi-17.11.0922-Yohanes Eudes Anjas Susetya - Yohanes Eudes Anjas Susetya.pdf
Restricted to Repository staff only

Download (685kB)

Abstract

Forum diskusi online merupakan tempat untuk berkumpul pengguna internet yang di dalamnya kita bisa berbagi informasi dan berdiskusi antar pengguna forum mengenai suatu topik tertentu. Mengingat semakin bertambahnya pengguna internet saat ini juga membuat forum diskusi semakin ramai dan aktif dalam melakukan tanya jawab. Dengan banyaknya pengguna menyebabkan setiap pengguna di dalam forum menanyakan pertanyaan dengan maksud yang sama namun dengan kata yang berbeda. Oleh sebab itu penelitian ini menggunakan data pertanyaan forum tanya jawab untuk melakukan identifikasi duplikat pertanyaan yang diperoleh dari situs web Quora Indonesia. Pada penelitian ini data diklasifikasikan menggunakan Bidirectional Long Short Term Memory atau Bi-LSTM. Pertanyaan yang diidentifikasi akan memiliki 2 label yaitu duplicate dan not_diplicate. Untuk merepresentasikan kata ke dalam vektor, penelitian ini menggunakan word embedding. Penelitian ini bertujuan untuk mengetahui berapa hasil akurasi dari word embedding yang digunakan dalam identifikasi duplikat pasangan pertanyaan menggunakan Bahasa Indonesia. Metode word embedding yang digunakan adalah Global Vector (GloVe). Dari percobaan word embedding metode Global Vector (GloVe) yang dilakukan dengan pembagian data training 80% dan data test 20% dari total jumlah dataset 10000 mendapatkan hasil akurasi 95% dengan presisi 96%, recall 93% dan f1-score 94%.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Hayaty, Mardhiya
Uncontrolled Keywords: Quora, Identifikasi Pertanyaan, Word Embedding, GloVe, Bi-LSTM
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 24 Jun 2022 03:28
Last Modified: 16 Aug 2023 03:20
URI: http://eprints.amikom.ac.id/id/eprint/2464

Actions (login required)

View Item View Item