METODE "BIDIRECTIONAL ENCODER REPRESENTATIONS FROM TRANSFORMERS" (BERT) DALAM PERHITUNGAN SEMANTIC SIMILARITY

Pratama, Dhimas Yoga (2020) METODE "BIDIRECTIONAL ENCODER REPRESENTATIONS FROM TRANSFORMERS" (BERT) DALAM PERHITUNGAN SEMANTIC SIMILARITY. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (1MB)
[img] Text (BAB I)
BAB I.pdf

Download (277kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (903kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (187kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (836kB)
[img] Text (BAB V)
BAB V.pdf

Download (60kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (207kB)
[img] Archive (SOURCE CODE)
Source Code-17.11.0972-Dhimas Yoga Pratama - Dhimas Yoga Pratama.zip
Restricted to Repository staff only

Download (59kB)
[img] Text (PUBLIKASI)
Publikasi-17.11.0972-Dhimas Yoga Pratama - Dhimas Yoga Pratama.pdf
Restricted to Repository staff only

Download (978kB)

Abstract

Quora adalah situs forum online yang digunakan oleh banyak pengguna dari seluruh dunia untuk melakukan tanya jawab mengenai topik tertentu. Mengingat banyaknya pengguna yang menggunakan layanan ini dan aktif dalam melakukan tanya jawab menyebabkan setiap pengguna menanyakan pertanyaan dengan makna yang sama namun dengan kata yang berbeda, inilah yang menyebabkan adanya masalah duplikasi pertanyaan. Oleh sebab itu diperlukan metode yang dapat mengidentifikasi adanya duplikasi dari pertanyaan yang di-inputkan pengguna. Penelitian ini menggunakan sebuah metode dalam deep learning yaitu Bidirectional Encoder Representation from Transformer atau BERT sebagai metode untuk membuat word embedding. Untuk memprediksi probabilitas kemiripan pertanyaan digunakan metode logistic regression. Pertanyaan yang diidentifikasi akan memiliki 2 label yaitu duplicate dan not_duplicate. Proses permodelan dilakukan sebanyak 8 epochs. Data yang digunakan merupakan judul pertanyaan yang diambil dari situs Quora dengan teknik scraping. Total pasangan judul pertanyaan adalah sebanyak 10.000 pasang dengan pembagian data latih sebanyak 70%, data evaluasi sebanyak 10%, dan data uji sebanyak 20%. Dari hasil pengujian prediksi probabilitas kemiripan didapatkan nilai akurasi sebesar 99% .

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Hayaty, Mardhiya
Uncontrolled Keywords: Quora, Deep Learning, BERT, Word Embedding, Logistic Regression
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 23 Jun 2022 06:49
Last Modified: 16 Aug 2023 02:20
URI: http://eprints.amikom.ac.id/id/eprint/2384

Actions (login required)

View Item View Item