Hidayat, Wahyu (2021) ANALISIS PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI PADA PERBANDINGAN ALGORITMA WINNOWING DAN ALGORITMA RATCLIFF/OBERSHELP PADA PENDETEKSI KESAMAAN PRODUK DI MARKETPLACE. S2 - Magister thesis, Universitas AMIKOM Yogyakarta.
Text
19.51.1181-Wahyu Hidayat.pdf - Published Version Download (8MB) |
Abstract
Persaingan dalam penjualan produk sejenis menjadi meningkat karena semakin banyak pemasaran produk yang sama di marketplace. P-store.net merupakan marketplace yang menjadi platform jual beli produk fisik dan digital, produk yang dijual mendominasi produk karya sendiri. Identifikasi kesamaan produk diperlukan untuk mengetahui tingkat duplikasi produk pada persaingan produk sejenis. Perlu pengujian algoritma similarity dan penerapan pengaruh algoritma stemming pada pendeteksi kesamaan produk untuk mengetahui tingkat akurasi, efisiensi serta performa stemming. Penentuan jumlah dataset menurut rumus Wibisono, dataset yang digunakan sebanyak 100 produk selanjutnya dibagai menjadi 50% untuk data dengan indikasi duplikat dan 50% untuk data dengan indikasi tidak duplikat. Algoritma Winnowing dan algoritma Ratcliff/Obershelp dibandingkan untuk mengetahui tingkat akurasi dan efisiensi dalam mendeteksi kesamaan antar produk. Algoritma stemming Nazief & Adriani diterapkan untuk tahap stemming pada text preprocessing sehingga dapat diketahui hasil performa dalam perbandingan algoritma similarity. Algoritma stemming Nazief & Adriani menambah waktu pemrosesan dari text preprocessing hingga hasil nilai similarity ditemukan dengan total rata-rata selisih penambahan waktu algoritma Winnowing 7,45 detik dan algoritma Ratcliff/Obershelp 7,44 detik dan menyebabkan hasil penurunan nilai rata-rata similarity secara garis besar terhadap dua algoritma tersebut. Algoritma Ratcliff/Obershelp lebih efisien daripada algoritma Winnowing pada 4 pengujian dan 2 pengujian lainnya seimbang. Hasil akurasi terbaik indikasi produk tidak duplikat didapatkan algoritma Winnowing dengan stemming Nazief & Adriani pada nilai k = 7 dan tipe data deskripsi dengan nilai similarity 8,12% (plagiarism ringan). Hasil akurasi terbaik indikasi produk duplikat diperoleh algoritma Ratcliff/Obershelp tanpa stemming pada tipe data judul dengan nilai similarity 86,91% (plagiarisme berat atau total).
Item Type: | Thesis (S2 - Magister) | ||
---|---|---|---|
Contributor: |
|
||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data | ||
Divisions: | Pascasarjana MTI > Magister Teknik Informatika | ||
Depositing User: | Resource Center Universitas Amikom Yogyakarta | ||
Date Deposited: | 17 Jan 2022 03:58 | ||
Last Modified: | 20 Jan 2022 06:49 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/111 |
Actions (login required)
View Item |