PENGARUH PENERAPAN 4 TEKNIK PREPROCESSING PADA KINERJA AUTOMATIC TEXT SUMMARIZATION

Juna, Muhammad Farhan (2022) PENGARUH PENERAPAN 4 TEKNIK PREPROCESSING PADA KINERJA AUTOMATIC TEXT SUMMARIZATION. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (1MB)
[img] Text (BAB I)
BAB I.pdf

Download (192kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (678kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (228kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (188kB)
[img] Text (BAB V)
BAB V.pdf

Download (31kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (119kB)
[img] Archive (SOURCE CODE)
Source Code 19.11.3091 Muhammad Farhan Juna.zip
Restricted to Repository staff only

Download (89MB)
[img] Text (PUBLIKASI)
Publikasi 19.11.3091 Muhammad Farhan Juna.pdf
Restricted to Repository staff only

Download (505kB)

Abstract

Informasi digital saat ini meningkat dengan sangat cepat dan manusia harus mengatasi ratusan hingga ribuan informasi di internet saat mencari informasi. Namun, ketika sebuah informasi terlalu panjang membuat sulit bagi pembacanya untuk memahami informasi secara cepat. Salah satu cara untuk mengatasi masalah ini adalah menggunakan Automatic text summarization (ATS). Permasalahan muncul ketika data yang digunakan dalam peringkas teks masih bersifat kotor seperti tanda baca, URLs, karakter kosong, dll. Preprocessing merupakan tahap penting dalam ATS untuk membersihkan data kotor sehingga, penelitian ini bertujuan untuk mengetahui seberapa besar pengaruh preprocessing terhadap hasil kualitas ringkasan dalam peringkasan teks otomatis. Oleh karena itu, penelitian ini mengusulkan 16 skenario eksperimen yang akan menggunakan pre-trained model dari IndoBERT. Kajian ini akan secara khusus membahas teknik preprocessing dengan melakukan serangkaian percobaan dengan kombinasi preprocessing seperti data cleaning, stopwords, stemming, dan case folding. Kemudian, hasil penelitian akan diukur dengan menggunakan evaluasi ROUGE. Hasil penelitian ini menunjukkan bahwa kinerja terbaik diperoleh dengan menggunakan kombinasi pembersihan data dan pelipatan kasus, dengan skor ROUGE-1 (0,78), ROUGE-2 (0,60), dan ROUGE-L (0,68).

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Hayaty, Mardhiya
Uncontrolled Keywords: Automatic Text Summarization, Preprocessing, Rouge, Data Cleaning, Peringkas Teks.
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 13 Apr 2023 04:37
Last Modified: 26 Jul 2023 04:12
URI: http://eprints.amikom.ac.id/id/eprint/18521

Actions (login required)

View Item View Item