Darussalam, Hanif Tofa (2025) PEMODELAN TOPIK MELALUI MEDIA X MENGGUNAKAN APACHE SPARK (STUDI KASUS COVID-19 DI INDONESIA TAHUN 2020-2022). S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
![]() |
Text (COVER-ABSTRAK)
COVER.pdf Download (959kB) |
![]() |
Text (BAB I)
BAB I.pdf Download (154kB) |
![]() |
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (691kB) |
![]() |
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (734kB) |
![]() |
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (1MB) |
![]() |
Text (BAB V)
BAB V.pdf Download (86kB) |
![]() |
Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf Restricted to Registered users only Download (239kB) |
![]() |
Archive (SOURCE CODE)
Sourcecode - 18.12.0751.zip Restricted to Repository staff only Download (3kB) |
![]() |
Text (PUBLIKASI)
Publikasi.pdf Restricted to Repository staff only Download (737kB) |
Abstract
Pandemi COVID-19 yang terjadi di Indonesia selama periode 2020–2022 telah mendorong berbagai diskusi serta pertukaran opini di media sosial, termasuk Media X. Platform ini menghasilkan data dalam jumlah besar dan bersifat tidak terstruktur, sehingga dibutuhkan metode yang efektif untuk menganalisis serta mengidentifikasi pola topik yang muncul. Penelitian ini berfokus pada pemodelan topik dari data Media X dengan memanfaatkan Apache Spark sebagai kerangka kerja pemrosesan big data. Metode yang digunakan dalam penelitian ini adalah Latent Dirichlet Allocation (LDA), yang diterapkan dalam lingkungan Apache Spark untuk menangani data dalam jumlah besar secara paralel dan terdistribusi. Proses analisis meliputi pengumpulan data, penyimpanan data, pra-pemrosesan data, vektorisasi teks, pemodelan topik, evaluasi dan visualisasi. Hasil penelitian menunjukkan bahwa metode ini mampu mengidentifikasi topik-topik utama yang berkembang selama pandemi COVID-19 di Indonesia, seperti kesehatan, vaksinasi, kebijakan pemerintah, serta persepsi masyarakat terhadap pandemi. Sebanyak 10 topik ditentukan untuk dianalisis dalam penelitian ini. Model dievaluasi menggunakan dua metrik utama, yaitu perplexity dan coherence score, dengan hasil masing-masing 5.5987700238050815 dan 0.6061784364959958. Hasil ini menunjukkan bahwa coherence score lebih relevan dalam menilai kualitas topik yang dihasilkan, karena memberikan gambaran yang lebih jelas tentang keterkaitan dan kebermaknaan kata-kata dalam setiap topik dibandingkan perplexity.
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Latent Dirichlet Allocation, Pemodelan Topik, Skor Koherensi, COVID-19, Perplexity | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus |
||
Divisions: | Fakultas Ilmu Komputer > Sistem Informasi | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 25 Apr 2025 04:04 | ||
Last Modified: | 25 Apr 2025 04:04 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/29681 |
Actions (login required)
![]() |
View Item |