Asy’ari, Ahmad Hasyim (2025) MODEL KLASTERISASI TOPIK HADIS PADA HADIS BUKHARI-MUSLIM BERBASIS INTEGRASI EMBEDDING BERT DENGAN FITUR SEMANTIK TAMBAHAN PANJANG TEKS DAN TF-IDF. S2 - Magister thesis, Universitas AMIKOM Yogyakarta.
|
Text (THESIS)
23.55.2522 - Ahmad Hasyim Asy'ari.pdf - Published Version Download (5MB) |
Abstract
Klastering hadis merupakan tugas penting dalam studi Islam, mengingat sifat korpus hadis yang luas dan kompleks. Pendekatan pengelompokan tradisional sering kali kesulitan untuk menangkap konteks semantik yang mendalam dalam hadis, yang menyebabkan pengelompokan topik menjadi kurang akurat. Kemajuan terkini dalam Natural Language Processing (NLP), seperti model Bidirectional Encoder Representations from Transformers (BERT), telah menunjukkan hasil yang menjanjikan dalam mengatasi tantangan ini dengan menyediakan penyematan kontekstual yang kaya. Namun, penggunaan BERT secara tunggal dapat mengabaikan fitur linguistik yang penting, yang berpotensi membatasi kinerja pengelompokan. Studi ini mengusulkan model pengelompokan yang disempurnakan untuk koleksi hadis Sahih Bukhari dan Sahih Muslim, yang mengintegrasikan penyematan BERT dengan fitur semantik tambahan, termasuk panjang teks, Term Frequency (TF), dan Inverse Document Frequency (IDF). Dengan menggunakan kerangka BERTopic, pendekatan ini menangkap hubungan yang bernuansa antara hadis, yang memberikan hasil pengelompokan yang lebih akurat secara kontekstual. Eksperimen menunjukkan bahwa metode terintegrasi ini secara signifikan meningkatkan kinerja pengelompokan, seperti yang ditunjukkan oleh silhouette score dengan nilai -0.1 dan davies-bouldin index 2.6. Sedangkan tanpa terintegrasi menunjukkan nilai rendah dengan silhouette score dengan nilai 0.145 dan davies-bouldin index 6.6. Sehingga pengembangan ini menawarkan metode yang lebih tepat untuk pengelompokan topik dalam studi Islam, yang memfasilitasi organisasi dan pemahaman yang lebih baik tentang teks hadis.
| Item Type: | Thesis (S2 - Magister) | ||
|---|---|---|---|
| Contributor: |
|
||
| Uncontrolled Keywords: | Klasterisasi Hadis, Fitur Semantik, BERTopic, NLP, Hadis, Semantic Features. | ||
| Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 003 Sistem-sistem |
||
| Divisions: | Pascasarjana Magister Informatika > PJJ Magister Informatika | ||
| Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
| Date Deposited: | 26 Jun 2026 04:05 | ||
| Last Modified: | 26 Jun 2026 04:05 | ||
| URI: | http://eprints.amikom.ac.id/id/eprint/31748 |
Actions (login required)
![]() |
View Item |

