relation: https://eprints.amikom.ac.id/id/eprint/31748/ title: MODEL KLASTERISASI TOPIK HADIS PADA HADIS BUKHARI-MUSLIM BERBASIS INTEGRASI EMBEDDING BERT DENGAN FITUR SEMANTIK TAMBAHAN PANJANG TEKS DAN TF-IDF creator: Asy’ari, Ahmad Hasyim subject: 000 Ilmu komputer, informasi dan pekerjaan umum subject: 003 Sistem-sistem description: Klastering hadis merupakan tugas penting dalam studi Islam, mengingat sifat korpus hadis yang luas dan kompleks. Pendekatan pengelompokan tradisional sering kali kesulitan untuk menangkap konteks semantik yang mendalam dalam hadis, yang menyebabkan pengelompokan topik menjadi kurang akurat. Kemajuan terkini dalam Natural Language Processing (NLP), seperti model Bidirectional Encoder Representations from Transformers (BERT), telah menunjukkan hasil yang menjanjikan dalam mengatasi tantangan ini dengan menyediakan penyematan kontekstual yang kaya. Namun, penggunaan BERT secara tunggal dapat mengabaikan fitur linguistik yang penting, yang berpotensi membatasi kinerja pengelompokan. Studi ini mengusulkan model pengelompokan yang disempurnakan untuk koleksi hadis Sahih Bukhari dan Sahih Muslim, yang mengintegrasikan penyematan BERT dengan fitur semantik tambahan, termasuk panjang teks, Term Frequency (TF), dan Inverse Document Frequency (IDF). Dengan menggunakan kerangka BERTopic, pendekatan ini menangkap hubungan yang bernuansa antara hadis, yang memberikan hasil pengelompokan yang lebih akurat secara kontekstual. Eksperimen menunjukkan bahwa metode terintegrasi ini secara signifikan meningkatkan kinerja pengelompokan, seperti yang ditunjukkan oleh silhouette score dengan nilai -0.1 dan davies-bouldin index 2.6. Sedangkan tanpa terintegrasi menunjukkan nilai rendah dengan silhouette score dengan nilai 0.145 dan davies-bouldin index 6.6. Sehingga pengembangan ini menawarkan metode yang lebih tepat untuk pengelompokan topik dalam studi Islam, yang memfasilitasi organisasi dan pemahaman yang lebih baik tentang teks hadis. date: 2025-10-10 type: Thesis type: NonPeerReviewed format: text language: id identifier: https://eprints.amikom.ac.id/id/eprint/31748/1/23.55.2522%20-%20Ahmad%20Hasyim%20Asy%27ari.pdf identifier: Asy’ari, Ahmad Hasyim (2025) MODEL KLASTERISASI TOPIK HADIS PADA HADIS BUKHARI-MUSLIM BERBASIS INTEGRASI EMBEDDING BERT DENGAN FITUR SEMANTIK TAMBAHAN PANJANG TEKS DAN TF-IDF. S2 - Magister thesis, Universitas AMIKOM Yogyakarta.