Juna, Muhammad Farhan (2022) PENGARUH PENERAPAN 4 TEKNIK PREPROCESSING PADA KINERJA AUTOMATIC TEXT SUMMARIZATION. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
Text (COVER-ABSTRAK)
COVER.pdf Download (1MB) |
|
Text (BAB I)
BAB I.pdf Download (192kB) |
|
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (678kB) |
|
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (228kB) |
|
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (188kB) |
|
Text (BAB V)
BAB V.pdf Download (31kB) |
|
Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf Restricted to Registered users only Download (119kB) |
|
Archive (SOURCE CODE)
Source Code 19.11.3091 Muhammad Farhan Juna.zip Restricted to Repository staff only Download (89MB) |
|
Text (PUBLIKASI)
Publikasi 19.11.3091 Muhammad Farhan Juna.pdf Restricted to Repository staff only Download (505kB) |
Abstract
Informasi digital saat ini meningkat dengan sangat cepat dan manusia harus mengatasi ratusan hingga ribuan informasi di internet saat mencari informasi. Namun, ketika sebuah informasi terlalu panjang membuat sulit bagi pembacanya untuk memahami informasi secara cepat. Salah satu cara untuk mengatasi masalah ini adalah menggunakan Automatic text summarization (ATS). Permasalahan muncul ketika data yang digunakan dalam peringkas teks masih bersifat kotor seperti tanda baca, URLs, karakter kosong, dll. Preprocessing merupakan tahap penting dalam ATS untuk membersihkan data kotor sehingga, penelitian ini bertujuan untuk mengetahui seberapa besar pengaruh preprocessing terhadap hasil kualitas ringkasan dalam peringkasan teks otomatis. Oleh karena itu, penelitian ini mengusulkan 16 skenario eksperimen yang akan menggunakan pre-trained model dari IndoBERT. Kajian ini akan secara khusus membahas teknik preprocessing dengan melakukan serangkaian percobaan dengan kombinasi preprocessing seperti data cleaning, stopwords, stemming, dan case folding. Kemudian, hasil penelitian akan diukur dengan menggunakan evaluasi ROUGE. Hasil penelitian ini menunjukkan bahwa kinerja terbaik diperoleh dengan menggunakan kombinasi pembersihan data dan pelipatan kasus, dengan skor ROUGE-1 (0,78), ROUGE-2 (0,60), dan ROUGE-L (0,68).
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Automatic Text Summarization, Preprocessing, Rouge, Data Cleaning, Peringkas Teks. | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum | ||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 13 Apr 2023 04:37 | ||
Last Modified: | 26 Jul 2023 04:12 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/18521 |
Actions (login required)
View Item |