PENERAPAN ALGORITMA BIDIRECTIONAL ENCODER FROM TRANSFORMER UNTUK MENDETEKSI PLAGIARISME PADA KODE PROGRAM BAHASA C++

Taufiqurrahman, Bayu (2023) PENERAPAN ALGORITMA BIDIRECTIONAL ENCODER FROM TRANSFORMER UNTUK MENDETEKSI PLAGIARISME PADA KODE PROGRAM BAHASA C++. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (1MB)
[img] Text (BAB I)
BAB I.pdf

Download (150kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (523kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (146kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (580kB)
[img] Text (BAB V)
BAB V.pdf

Download (48kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (78kB)
[img] Archive (SOURCE CODE)
Sourcecode - Bayu Taufiqurrahman.zip
Restricted to Repository staff only

Download (164kB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (1MB)

Abstract

Plagiarisme merupakan sebuah tindakan yang mengambil karya, ide, ataupun informasi tanpa sepengetahuan pemilik hak cipta kemudian mengakuinya atas miliknya sendiri. Tugas akhir pemrograman setiap semester rentan terhadap plagiarisme oleh mahasiswa. Untuk mendeteksi adanya perbuatan plagiarisme, penelitian ini menggunakan algoritma bidirectional encoder from transformer. Algoritma bidirectional encoder from transformer diperkenalkan oleh Google untuk meningkatkan ketepatan mesin pencarian miliknya. Penelitian ini dilakukan melalui beberapat tahap yaitu (1) data cleansing tujuannya untuk membuang data yang tidak dapat terpakai agar tidak menyebabkan overfitting maupun underfitting. (2) Visualisasi data merupakan tahap mengetahui data yang digunakan untuk training. (3) Training dan testing data merupakan sebuah proses untuk melatih dan mengetahui hasil dari algoritma yang diterapkan. Dataset yang digunakan untuk penelitian ini berasal dari IBM dengan total seribu empat ratus kode program bahasa C++ yang setiap kodenya sudah dilabeli dengan waktu proses cpu, dan penggunaan memori yang digunakan saat program dijalankan. Dataset ini akan dilakukan preprocessing terlebih dahulu seperti data cleansing dan tokenizing. Hasil dari penelitian diharapkan dapat membuat para pengajar lebih mudah untuk mengatasi plagiarisme kode program bahasa C++.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Pristyanto, Yoga
Uncontrolled Keywords: Bert, nlp, Transformer, Machine learning, Plagiarisme
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 01 Nov 2023 03:57
Last Modified: 01 Nov 2023 03:57
URI: http://eprints.amikom.ac.id/id/eprint/22384

Actions (login required)

View Item View Item