eprintid: 31748 rev_number: 8 eprint_status: archive userid: 12 dir: disk0/00/03/17/48 datestamp: 2026-06-26 04:05:17 lastmod: 2026-06-26 04:05:17 status_changed: 2026-06-26 04:05:17 type: thesis metadata_visibility: show creators_name: Asy’ari, Ahmad Hasyim creators_nim: 23.55.2522 contributors_name: -, Hanafi corp_creators: Universitas AMIKOM Yogyakarta title: MODEL KLASTERISASI TOPIK HADIS PADA HADIS BUKHARI-MUSLIM BERBASIS INTEGRASI EMBEDDING BERT DENGAN FITUR SEMANTIK TAMBAHAN PANJANG TEKS DAN TF-IDF ispublished: pub subjects: 000.000.000A subjects: 000.000.003 divisions: PJJ full_text_status: public keywords: Klasterisasi Hadis, Fitur Semantik, BERTopic, NLP, Hadis, Semantic Features. abstract: Klastering hadis merupakan tugas penting dalam studi Islam, mengingat sifat korpus hadis yang luas dan kompleks. Pendekatan pengelompokan tradisional sering kali kesulitan untuk menangkap konteks semantik yang mendalam dalam hadis, yang menyebabkan pengelompokan topik menjadi kurang akurat. Kemajuan terkini dalam Natural Language Processing (NLP), seperti model Bidirectional Encoder Representations from Transformers (BERT), telah menunjukkan hasil yang menjanjikan dalam mengatasi tantangan ini dengan menyediakan penyematan kontekstual yang kaya. Namun, penggunaan BERT secara tunggal dapat mengabaikan fitur linguistik yang penting, yang berpotensi membatasi kinerja pengelompokan. Studi ini mengusulkan model pengelompokan yang disempurnakan untuk koleksi hadis Sahih Bukhari dan Sahih Muslim, yang mengintegrasikan penyematan BERT dengan fitur semantik tambahan, termasuk panjang teks, Term Frequency (TF), dan Inverse Document Frequency (IDF). Dengan menggunakan kerangka BERTopic, pendekatan ini menangkap hubungan yang bernuansa antara hadis, yang memberikan hasil pengelompokan yang lebih akurat secara kontekstual. Eksperimen menunjukkan bahwa metode terintegrasi ini secara signifikan meningkatkan kinerja pengelompokan, seperti yang ditunjukkan oleh silhouette score dengan nilai -0.1 dan davies-bouldin index 2.6. Sedangkan tanpa terintegrasi menunjukkan nilai rendah dengan silhouette score dengan nilai 0.145 dan davies-bouldin index 6.6. Sehingga pengembangan ini menawarkan metode yang lebih tepat untuk pengelompokan topik dalam studi Islam, yang memfasilitasi organisasi dan pemahaman yang lebih baik tentang teks hadis. date: 2025-10-10 date_type: published institution: Universitas AMIKOM Yogyakarta department: Pascasarjana Magister Informatika thesis_type: masters thesis_name: tesis citation: Asy’ari, Ahmad Hasyim (2025) MODEL KLASTERISASI TOPIK HADIS PADA HADIS BUKHARI-MUSLIM BERBASIS INTEGRASI EMBEDDING BERT DENGAN FITUR SEMANTIK TAMBAHAN PANJANG TEKS DAN TF-IDF. S2 - Magister thesis, Universitas AMIKOM Yogyakarta. document_url: https://eprints.amikom.ac.id/id/eprint/31748/1/23.55.2522%20-%20Ahmad%20Hasyim%20Asy%27ari.pdf