<mods:mods version="3.3" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-3.xsd" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"><mods:titleInfo><mods:title>MODEL KLASTERISASI TOPIK HADIS PADA HADIS&#13;
BUKHARI-MUSLIM BERBASIS INTEGRASI EMBEDDING &#13;
BERT DENGAN FITUR SEMANTIK TAMBAHAN PANJANG&#13;
TEKS DAN TF-IDF</mods:title></mods:titleInfo><mods:name type="personal"><mods:namePart type="given">Ahmad Hasyim</mods:namePart><mods:namePart type="family">Asy’ari</mods:namePart><mods:role><mods:roleTerm type="text">author</mods:roleTerm></mods:role></mods:name><mods:abstract>Klastering hadis merupakan tugas penting dalam studi Islam, mengingat&#13;
sifat korpus hadis yang luas dan kompleks. Pendekatan pengelompokan tradisional&#13;
sering kali kesulitan untuk menangkap konteks semantik yang mendalam dalam&#13;
hadis, yang menyebabkan pengelompokan topik menjadi kurang akurat. Kemajuan&#13;
terkini dalam Natural Language Processing (NLP), seperti model Bidirectional&#13;
Encoder Representations from Transformers (BERT), telah menunjukkan hasil&#13;
yang menjanjikan dalam mengatasi tantangan ini dengan menyediakan penyematan&#13;
kontekstual yang kaya. Namun, penggunaan BERT secara tunggal dapat&#13;
mengabaikan fitur linguistik yang penting, yang berpotensi membatasi kinerja&#13;
pengelompokan. Studi ini mengusulkan model pengelompokan yang&#13;
disempurnakan untuk koleksi hadis Sahih Bukhari dan Sahih Muslim, yang&#13;
mengintegrasikan penyematan BERT dengan fitur semantik tambahan, termasuk&#13;
panjang teks, Term Frequency (TF), dan Inverse Document Frequency (IDF).&#13;
Dengan menggunakan kerangka BERTopic, pendekatan ini menangkap hubungan&#13;
yang bernuansa antara hadis, yang memberikan hasil pengelompokan yang lebih&#13;
akurat secara kontekstual. Eksperimen menunjukkan bahwa metode terintegrasi ini&#13;
secara signifikan meningkatkan kinerja pengelompokan, seperti yang ditunjukkan&#13;
oleh silhouette score dengan nilai -0.1 dan davies-bouldin index 2.6. Sedangkan&#13;
tanpa terintegrasi menunjukkan nilai rendah dengan silhouette score dengan nilai 0.145&#13;
&#13;
dan davies-bouldin index 6.6.  Sehingga pengembangan ini menawarkan&#13;
metode yang lebih tepat untuk pengelompokan topik dalam studi Islam, yang&#13;
memfasilitasi organisasi dan pemahaman yang lebih baik tentang teks hadis.</mods:abstract><mods:classification authority="lcc">000 Ilmu komputer, informasi dan pekerjaan umum</mods:classification><mods:classification authority="lcc">003 Sistem-sistem</mods:classification><mods:originInfo><mods:dateIssued encoding="iso8061">2025-10-10</mods:dateIssued></mods:originInfo><mods:originInfo><mods:publisher>Universitas AMIKOM Yogyakarta;Pascasarjana Magister Informatika</mods:publisher></mods:originInfo><mods:genre>Thesis</mods:genre></mods:mods>