Lewu, Retzi Yosia (2024) KOMPARASI ALGORITMA KLASIFIKASI TEKS DENGAN METODE EKSTRAKSI N-GRAM PADA HASIL MEDIASI PERKARA PERDATA DI PENGADILAN NEGERI. S2 - Magister thesis, Universitas AMIKOM Yogyakarta.
![]() |
Text (THESIS)
22.55.2300 Retzi Yosia Lewu.pdf Download (6MB) |
Abstract
Penelitian ini bertujuan melakukan komparasi penggunaan algoritma klasifikasi teks dalam pemodelan untuk memprediksi status keberhasilan mediasi berdasarkan dokumen – dokumen hasil mediasi perkara perdata terdahulu dengan metode ekstraksi n-gram. Proses analisis dilakukan melalui Seleksi Data, Persiapan Data, Pra-pemrosesan, Implementasi N-gram, Pembobotan TF-IDF, Pemodelan, dan Evaluasi Model dilanjutkan dengan komparasi performa algoritma. Penelitian ini diharapkan memperoleh gambaran algoritma mana yang memiliki performa terbaik dalam mengoptimalkan prediksi hasil mediasi. Seleksi data dilakukan terhadap 2591 data awal untuk memilah data yang dapat digunakan dan yang tidak, dilanjutkan dengan persiapan dengan hanya menggunakan 2 (dua) status hasil mediasi yaitu Y = mediasi berhasil dan T = mediasi gagal. Dalam pra-pemrosesan digunakan beberapa teknik yaitu perubahan huruf pada kolom petitum menjadi huruf kecil, pembersihan dengan menghilangkan tag HTML, tanda baca, simbol dan juga angka, dilanjutkan dengan tokenisasi untuk mendapatkan unit kata dalam kalimat. Proses selanjutnya adalah pencarian akar kata dengan memotong imbuhan menggunakan library Sastrawi yang dibuat khusus untuk Bahasa Indonesia kemudian disaring menggunakan kamus kata Sastrawi. Dataset kemudian dipisah dengan perbandingan 70:30 untuk data latih dan data uji. Terhadap data latih dilakukan implementasi n-gram yang kemudian dihitung nilai TF-IDFnya untuk melihat sejauh mana pemilihan nilai n mempengaruhi TF-IDF. Hasilnya diproses lebih lanjut untuk membuat model menggunakan algoritma Naïve Bayes, Regresi Logistik, Pohon Keputusan dan Support Vector Machine (SVM). Dengan data uji model tersebut dievaluasi performanya menggunakan metrik akurasi, presisi, pemanggilan kembali dan skor F1. Hasil penelitian menunjukkan bahwa hasil mediasi terdahulu dapat digunakan untuk membuat model prediksi hasil mediasi dengan kolom petitum sebagai target. Penggunaan fitur ekstraksi n-gram dengan nilai n antara 1 hingga 5 mempengaruhi performa model. Implementasi Algoritma menunjukkan bahwa untuk Kelas T, Regresi Logistik dan Pohon Keputusan menunjukkan performa terbaik dengan akurasi sangat tinggi dan metrik kinerja yang seimbang. Untuk Kelas Y, Regresi Logistik dan Pohon Keputusan juga menunjukkan performa yang sangat baik pada n-gram lebih dari 1, sementara Naïve Bayes dan SVM gagal dalam klasifikasi ini pada n-gram unigram maupun n > 1. Penggunaan n > 1 sedikit meningkatkan performa terutama pada Kelas T, tetapi tidak memberikan keuntungan signifikan untuk Kelas Y di Naïve Bayes dan SVM. Logistic Regression dan Decision Tree tetap menunjukkan performa terbaik secara konsisten pada semua konfigurasi n-gram.
Item Type: | Thesis (S2 - Magister) | |||
---|---|---|---|---|
Contributor: |
|
|||
Uncontrolled Keywords: | Algoritma Klasifikasi Teks, N-Gram, Status Hasil Mediasi | |||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus |
|||
Divisions: | Pascasarjana Magister Informatika > PJJ Magister Informatika | |||
Depositing User: | RC Universitas AMIKOM Yogyakarta | |||
Date Deposited: | 21 Mar 2025 03:47 | |||
Last Modified: | 21 Mar 2025 03:47 | |||
URI: | http://eprints.amikom.ac.id/id/eprint/28965 |
Actions (login required)
![]() |
View Item |