KLASIFIKASI JUDUL BERITA CLICKBAIT BERBAHASA INDONESIA MENGGUNAKAN ALGORITMA GRADIENT BOOSTING TREE

Fathi, Muhammad Zhafar Al (2025) KLASIFIKASI JUDUL BERITA CLICKBAIT BERBAHASA INDONESIA MENGGUNAKAN ALGORITMA GRADIENT BOOSTING TREE. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf - Published Version

Download (1MB)
[img] Text (BAB I)
BAB I.pdf - Published Version

Download (254kB)
[img] Text (BAB II)
BAB II.pdf - Published Version
Restricted to Registered users only

Download (975kB)
[img] Text (BAB III)
BAB III.pdf - Published Version
Restricted to Registered users only

Download (440kB)
[img] Text (BAB IV)
BAB IV.pdf - Published Version
Restricted to Registered users only

Download (904kB)
[img] Text (BAB V)
BAB V.pdf - Published Version

Download (87kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf - Published Version
Restricted to Registered users only

Download (225kB)
[img] Text (PUBLIKASI)
Publikasi.pdf - Published Version
Restricted to Repository staff only

Download (501kB)

Abstract

Perkembangan clickbait di media digital Indonesia menimbulkan permasalahan serius dalam ekosistem jurnalistik, dimana praktik ini menurunkan kualitas informasi dan kepercayaan publik terhadap media. Judul-judul clickbait yang menggunakan bahasa hiperbolik dan emosional untuk memancing klik demi pendapatan iklan digital telah menyebar luas di berbagai platform berita daring, bahkan pada media arus utama yang sebelumnya kredibel. Fenomena ini diperparah oleh algoritma media sosial yang mendorong konten dengan tingkat interaksi tinggi, sehingga media cenderung memproduksi konten "clickworthy" alih-alih informatif. Penelitian ini mengembangkan model machine learning untuk klasifikasi otomatis judul berita clickbait berbahasa Indonesia menggunakan algoritma Gradient Boosting Tree dengan kombinasi fitur tekstual dan simbolik. Metodologi meliputi pengumpulan dataset CLICK-ID dari Kaggle yang berisi 15.000 judul berita, preprocessing dengan teknik data augmentation berbasis paraphrasing menggunakan ChatGPT untuk menyeimbangkan distribusi kelas, ekstraksi 19 fitur simbolik seperti tanda baca dan kata-kata sensasional, serta implementasi pipeline dengan TF-IDF Vectorizer dan LightGBM classifier. Optimalisasi dilakukan melalui hyperparameter tuning menggunakan framework Optuna dengan 500 trial. Model yang dikembangkan mencapai akurasi 83,23% dengan peningkatan performa sebesar 2,43% setelah optimalisasi, serta berhasil mereduksi ukuran model sebesar 35,15% menjadi 4.682 KB. Implementasi real-time dilakukan melalui REST API berbasis Flask dan bot Discord bernama "Hamzah Bot" yang dapat diakses publik. Hasil penelitian ini berkontribusi dalam meningkatkan literasi digital masyarakat dan membantu platform media dalam melakukan kurasi konten yang lebih selektif. Penelitian lebih lanjut dapat dikembangkan dengan eksplorasi teknik model quantization dan penggunaan dataset yang lebih terkini untuk meningkatkan akurasi dan efisiensi model.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Cahyono, Nuri
Uncontrolled Keywords: clickbait, gradient boosting, feature engineering, data augmentation.
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 03 Mar 2026 03:32
Last Modified: 03 Mar 2026 03:32
URI: http://eprints.amikom.ac.id/id/eprint/31729

Actions (login required)

View Item View Item