Sanjaya, Hafidz (2024) MODEL MULTILINGUAL NAMED ENTITY RECOGNITION UNTUK EKSTRAKSI LOKASI DAN WAKTU KEBAKARAN HUTAN. S2 - Magister thesis, Universitas AMIKOM Yogyakarta.
![]() |
Text (THESIS)
22.55.2287 - Hafidz Sanjaya.pdf Download (4MB) |
Abstract
Kelangkaan dan terbatasnya akses kepada dataset multibahasa dapat menghambat pelatihan model pengenalan entitas bernama, terutama untuk penerapan penginderaan media sosial dalam manajemen bencana, seperti peringatan dini terjadinya kebakaran hutan mengingat dampaknya yang dapat mengancam keanekaragaman hayati termasuk manusia. Selain itu, membuat dan mendapatkan dataset multibahasa berkualitas tinggi untuk mengekstrak informasi lokasi dan waktu kebakaran hutan menggunakan pengenalan entitas bernama juga memerlukan sumber daya dan upaya yang cukup besar. Sehingga, mengatasi langkanya ketersediaan dataset pengenalan entitas bernama multibahasa dalam peringatan dini terjadinya kebakaran hutan merupakan salah satu pendekatan yang mungkin dilakukan untuk mengurangi sumber daya dan upaya agar menjadi lebih efisien. Oleh karena itu, penelitian ini akan menggunakan suatu publik dataset dalam Bahasa Indonesia untuk disempurnakan pada beberapa pre-trained model multibahasa berbasis BERT seperti Multilingual BERT Cased , Multilingual BERT Uncased dan XLM-RoBERTa untuk membandingkan kinerjanya dalam mengekstraksi atau mengenali entitas lokasi dan waktu kebakaran hutan secara multibahasa dari teks media sosial seperti Twitter (Sekarang “X”). Hasil pelatihan menunjukkan XLM-RoBERTa memperoleh performa finetuning terbaik dengan accuracy 98,59%, precision 91,89%, recall 92,73% dan f1score 92,31% serta memperoleh performa terbaik pada pengujian dengan akurasi 98,53% dalam melakukan klasifikasi token. Hasil validasi tweet secara manual juga menunjukkan bahwa XLM-RoBERTa memperoleh akurasi tertinggi pada semua bahasa yang divalidasi yaitu Bahasa Indonesia 92,32%, Bahasa Inggris 73,97%, Bahasa Spanyol 77,45%, Italia 78,39% dan Slovakia 96,50%.
Item Type: | Thesis (S2 - Magister) | |||
---|---|---|---|---|
Contributor: |
|
|||
Uncontrolled Keywords: | Pengenalan Entitas Bernama, Kebakaran Hutan, Ekstraksi Informasi, Penginderaan Media Sosial, BERT | |||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus |
|||
Divisions: | Pascasarjana Magister Informatika > PJJ Magister Informatika | |||
Depositing User: | RC Universitas AMIKOM Yogyakarta | |||
Date Deposited: | 21 Mar 2025 03:59 | |||
Last Modified: | 21 Mar 2025 03:59 | |||
URI: | http://eprints.amikom.ac.id/id/eprint/28967 |
Actions (login required)
![]() |
View Item |