PEMODELAN TOPIK MELALUI MEDIA X MENGGUNAKAN APACHE SPARK (STUDI KASUS COVID-19 DI INDONESIA TAHUN 2020-2022)

Darussalam, Hanif Tofa (2025) PEMODELAN TOPIK MELALUI MEDIA X MENGGUNAKAN APACHE SPARK (STUDI KASUS COVID-19 DI INDONESIA TAHUN 2020-2022). S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (959kB)
[img] Text (BAB I)
BAB I.pdf

Download (154kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (691kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (734kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB V)
BAB V.pdf

Download (86kB)
[img] Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf
Restricted to Registered users only

Download (239kB)
[img] Archive (SOURCE CODE)
Sourcecode - 18.12.0751.zip
Restricted to Repository staff only

Download (3kB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (737kB)

Abstract

Pandemi COVID-19 yang terjadi di Indonesia selama periode 2020–2022 telah mendorong berbagai diskusi serta pertukaran opini di media sosial, termasuk Media X. Platform ini menghasilkan data dalam jumlah besar dan bersifat tidak terstruktur, sehingga dibutuhkan metode yang efektif untuk menganalisis serta mengidentifikasi pola topik yang muncul. Penelitian ini berfokus pada pemodelan topik dari data Media X dengan memanfaatkan Apache Spark sebagai kerangka kerja pemrosesan big data. Metode yang digunakan dalam penelitian ini adalah Latent Dirichlet Allocation (LDA), yang diterapkan dalam lingkungan Apache Spark untuk menangani data dalam jumlah besar secara paralel dan terdistribusi. Proses analisis meliputi pengumpulan data, penyimpanan data, pra-pemrosesan data, vektorisasi teks, pemodelan topik, evaluasi dan visualisasi. Hasil penelitian menunjukkan bahwa metode ini mampu mengidentifikasi topik-topik utama yang berkembang selama pandemi COVID-19 di Indonesia, seperti kesehatan, vaksinasi, kebijakan pemerintah, serta persepsi masyarakat terhadap pandemi. Sebanyak 10 topik ditentukan untuk dianalisis dalam penelitian ini. Model dievaluasi menggunakan dua metrik utama, yaitu perplexity dan coherence score, dengan hasil masing-masing 5.5987700238050815 dan 0.6061784364959958. Hasil ini menunjukkan bahwa coherence score lebih relevan dalam menilai kualitas topik yang dihasilkan, karena memberikan gambaran yang lebih jelas tentang keterkaitan dan kebermaknaan kata-kata dalam setiap topik dibandingkan perplexity.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Kusnawi, Kusnawi
Uncontrolled Keywords: Latent Dirichlet Allocation, Pemodelan Topik, Skor Koherensi, COVID-19, Perplexity
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus
Divisions: Fakultas Ilmu Komputer > Sistem Informasi
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 25 Apr 2025 04:04
Last Modified: 25 Apr 2025 04:04
URI: http://eprints.amikom.ac.id/id/eprint/29681

Actions (login required)

View Item View Item