KLASIFIKASI JUDUL BERITA CLICKBAIT BERBAHASA INDONESIA MENGGUNAKAN ALGORITMA GRADIENT BOOSTING TREE

Fathi, Muhammad Zhafar Al (2025) KLASIFIKASI JUDUL BERITA CLICKBAIT BERBAHASA INDONESIA MENGGUNAKAN ALGORITMA GRADIENT BOOSTING TREE. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

	Text (COVER-ABSTRAK) COVER.pdf - Published Version Download (1MB)
	Text (BAB I) BAB I.pdf - Published Version Download (254kB)
	Text (BAB II) BAB II.pdf - Published Version Restricted to Registered users only Download (975kB)
	Text (BAB III) BAB III.pdf - Published Version Restricted to Registered users only Download (440kB)
	Text (BAB IV) BAB IV.pdf - Published Version Restricted to Registered users only Download (904kB)
	Text (BAB V) BAB V.pdf - Published Version Download (87kB)
	Text (DAFTAR PUSTAKA) Daftar Pustaka.pdf - Published Version Restricted to Registered users only Download (225kB)
	Text (PUBLIKASI) Publikasi.pdf - Published Version Restricted to Repository staff only Download (501kB)

Abstract

Perkembangan clickbait di media digital Indonesia menimbulkan permasalahan serius dalam ekosistem jurnalistik, dimana praktik ini menurunkan kualitas informasi dan kepercayaan publik terhadap media. Judul-judul clickbait yang menggunakan bahasa hiperbolik dan emosional untuk memancing klik demi pendapatan iklan digital telah menyebar luas di berbagai platform berita daring, bahkan pada media arus utama yang sebelumnya kredibel. Fenomena ini diperparah oleh algoritma media sosial yang mendorong konten dengan tingkat interaksi tinggi, sehingga media cenderung memproduksi konten "clickworthy" alih-alih informatif. Penelitian ini mengembangkan model machine learning untuk klasifikasi otomatis judul berita clickbait berbahasa Indonesia menggunakan algoritma Gradient Boosting Tree dengan kombinasi fitur tekstual dan simbolik. Metodologi meliputi pengumpulan dataset CLICK-ID dari Kaggle yang berisi 15.000 judul berita, preprocessing dengan teknik data augmentation berbasis paraphrasing menggunakan ChatGPT untuk menyeimbangkan distribusi kelas, ekstraksi 19 fitur simbolik seperti tanda baca dan kata-kata sensasional, serta implementasi pipeline dengan TF-IDF Vectorizer dan LightGBM classifier. Optimalisasi dilakukan melalui hyperparameter tuning menggunakan framework Optuna dengan 500 trial. Model yang dikembangkan mencapai akurasi 83,23% dengan peningkatan performa sebesar 2,43% setelah optimalisasi, serta berhasil mereduksi ukuran model sebesar 35,15% menjadi 4.682 KB. Implementasi real-time dilakukan melalui REST API berbasis Flask dan bot Discord bernama "Hamzah Bot" yang dapat diakses publik. Hasil penelitian ini berkontribusi dalam meningkatkan literasi digital masyarakat dan membantu platform media dalam melakukan kurasi konten yang lebih selektif. Penelitian lebih lanjut dapat dikembangkan dengan eksplorasi teknik model quantization dan penggunaan dataset yang lebih terkini untuk meningkatkan akurasi dan efisiensi model.

Item Type:

Thesis (S1 - Sarjana)

Contributor:

Pembimbing
Cahyono, Nuri

Uncontrolled Keywords:

clickbait, gradient boosting, feature engineering, data augmentation.

Subjects:

000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer

Divisions:

Fakultas Ilmu Komputer > Informatika

Depositing User:

RC Universitas AMIKOM Yogyakarta

Date Deposited:

03 Mar 2026 03:32

Last Modified:

03 Mar 2026 03:32

URI:

http://eprints.amikom.ac.id/id/eprint/31729

Actions (login required)

View Item