Pratama, Dhimas Yoga (2020) METODE "BIDIRECTIONAL ENCODER REPRESENTATIONS FROM TRANSFORMERS" (BERT) DALAM PERHITUNGAN SEMANTIC SIMILARITY. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (1MB) |
|
Text (BAB I)
BAB I.pdf Download (277kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (903kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (187kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (836kB) |
|
Text (BAB V)
BAB V.pdf Download (60kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (207kB) |
|
Archive (SOURCE CODE)
Source Code-17.11.0972-Dhimas Yoga Pratama - Dhimas Yoga Pratama.zip Restricted to Repository staff only Download (59kB) |
|
Text (PUBLIKASI)
Publikasi-17.11.0972-Dhimas Yoga Pratama - Dhimas Yoga Pratama.pdf Restricted to Repository staff only Download (978kB) |
Abstract
Quora adalah situs forum online yang digunakan oleh banyak pengguna dari seluruh dunia untuk melakukan tanya jawab mengenai topik tertentu. Mengingat banyaknya pengguna yang menggunakan layanan ini dan aktif dalam melakukan tanya jawab menyebabkan setiap pengguna menanyakan pertanyaan dengan makna yang sama namun dengan kata yang berbeda, inilah yang menyebabkan adanya masalah duplikasi pertanyaan. Oleh sebab itu diperlukan metode yang dapat mengidentifikasi adanya duplikasi dari pertanyaan yang di-inputkan pengguna. Penelitian ini menggunakan sebuah metode dalam deep learning yaitu Bidirectional Encoder Representation from Transformer atau BERT sebagai metode untuk membuat word embedding. Untuk memprediksi probabilitas kemiripan pertanyaan digunakan metode logistic regression. Pertanyaan yang diidentifikasi akan memiliki 2 label yaitu duplicate dan not_duplicate. Proses permodelan dilakukan sebanyak 8 epochs. Data yang digunakan merupakan judul pertanyaan yang diambil dari situs Quora dengan teknik scraping. Total pasangan judul pertanyaan adalah sebanyak 10.000 pasang dengan pembagian data latih sebanyak 70%, data evaluasi sebanyak 10%, dan data uji sebanyak 20%. Dari hasil pengujian prediksi probabilitas kemiripan didapatkan nilai akurasi sebesar 99% .
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Quora, Deep Learning, BERT, Word Embedding, Logistic Regression | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer |
||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 23 Jun 2022 06:49 | ||
Last Modified: | 16 Aug 2023 02:20 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/2384 |
Actions (login required)
View Item |