<didl:DIDL xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS" xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS" xmlns:dip="urn:mpeg:mpeg21:2002:01-DIP-NS" xmlns:dcterms="http://purl.org/dc/terms/" DIDLDocumentId="http://eprints.amikom.ac.id/id/eprint/31772" xsi:schemaLocation="urn:mpeg:mpeg21:2002:02-DIDL-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/did/didl.xsd urn:mpeg:mpeg21:2002:01-DII-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/dii/dii.xsd urn:mpeg:mpeg21:2005:01-DIP-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/dip/dip.xsd">
  <didl:Item>
    <didl:Descriptor>
      <didl:Statement mimeType="application/xml">
        <dii:Identifier>http://eprints.amikom.ac.id/id/eprint/31772</dii:Identifier>
      </didl:Statement>
    </didl:Descriptor>
    <didl:Descriptor>
      <didl:Statement mimeType="application/xml">
        <dcterms:modified>2026-06-29T03:52:57Z</dcterms:modified>
      </didl:Statement>
    </didl:Descriptor>
    <didl:Component>
      <didl:Resource mimeType="application/xml" ref="https://eprints.amikom.ac.id/cgi/export/eprint/31772/DIDL/universitasamikomyogyakarta-eprint-31772.xml"/>
    </didl:Component>
    <didl:Item>
      <didl:Descriptor>
        <didl:Statement mimeType="application/xml">
          <dip:ObjectType>info:eu-repo/semantics/descriptiveMetadata</dip:ObjectType>
        </didl:Statement>
      </didl:Descriptor>
      <didl:Component>
        <didl:Resource mimeType="application/xml">
          <oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
        <dc:relation>https://eprints.amikom.ac.id/id/eprint/31772/</dc:relation>
        <dc:title>ANALISIS KINERJA DAN PENGEMBANGAN MODEL HYBRID TF-IDF &#13;
DAN SENTENCE EMBEDDING (SBERT/E5) UNTUK MENINGKATKAN &#13;
AKURASI SIMILARITY TEKS PADA REPOSITORY INSTITUSI &#13;
BERBAHASA INDONESIA &#13;
(Studi Kasus: eprints.amikom.ac.id)</dc:title>
        <dc:creator>Pratomo, Ero Wahyu</dc:creator>
        <dc:subject>000 Ilmu komputer, informasi dan pekerjaan umum</dc:subject>
        <dc:description>Penelitian ini mengembangkan dan menganalisis performa model hybrid&#13;
antara metode TF-IDF dan sentence embedding berbasis transformer (SBERT dan&#13;
E5) untuk meningkatkan akurasi pengukuran kemiripan (text similarity) pada&#13;
dokumen akademik berbahasa Indonesia. Permasalahan utama yang diangkat&#13;
adalah keterbatasan TF-IDF dalam menangkap konteks semantik serta tingginya&#13;
biaya komputasi apabila model embedding diterapkan secara penuh pada repositori&#13;
berskala besar (28.575 dokumen).&#13;
Untuk mengatasi hal tersebut, penelitian ini mengusulkan arsitektur hybrid&#13;
dua tahap: TF-IDF digunakan sebagai filter leksikal agresif dengan lost ratio&#13;
sebesar 0,9965 untuk mereduksi ruang pencarian, diikuti oleh reranking semantik&#13;
menggunakan SBERT dan E5. Hasil eksperimen menunjukkan bahwa model&#13;
SBERT unggul dalam stabilitas struktur klaster dengan skor ARI tertinggi (0,3444)&#13;
dan Davies-Bouldin Index terendah (2,7506), sedangkan E5 unggul dalam aspek&#13;
kelengkapan semantik dengan NMI sebesar 0,5183.&#13;
Dari sisi efisiensi, arsitektur hybrid berhasil memangkas waktu pemrosesan&#13;
secara signifikan. Metode Hybrid TF-IDF + E5 (3,71 detik) terbukti 47,7% lebih&#13;
cepat dibandingkan Hybrid TF-IDF + SBERT (7,10 detik). Secara keseluruhan,&#13;
pendekatan hybrid mampu meningkatkan kualitas similarity dan struktur klaster&#13;
dibandingkan penggunaan model tunggal. Model ini terbukti mampu&#13;
menyeimbangkan efisiensi komputasi dan ketepatan semantik, sehingga sangat&#13;
relevan untuk diimplementasikan pada sistem rekomendasi dokumen akademik&#13;
berskala besar di repositori institusi.</dc:description>
        <dc:date>2026-01-06</dc:date>
        <dc:type>Thesis</dc:type>
        <dc:type>NonPeerReviewed</dc:type>
        <dc:format>text</dc:format>
        <dc:language>id</dc:language>
        <dc:identifier>https://eprints.amikom.ac.id/id/eprint/31772/1/24.55.1583%20Ero%20Wahyu%20Pratomo.pdf</dc:identifier>
        <dc:identifier>  Pratomo, Ero Wahyu  (2026) ANALISIS KINERJA DAN PENGEMBANGAN MODEL HYBRID TF-IDF DAN SENTENCE EMBEDDING (SBERT/E5) UNTUK MENINGKATKAN AKURASI SIMILARITY TEKS PADA REPOSITORY INSTITUSI BERBAHASA INDONESIA (Studi Kasus: eprints.amikom.ac.id).  S2 - Magister thesis, Universitas AMIKOM Yogyakarta.   </dc:identifier></oai_dc:dc>
        </didl:Resource>
      </didl:Component>
    </didl:Item>
    <didl:Item>
      <didl:Descriptor>
        <didl:Statement mimeType="application/xml">
          <dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
        </didl:Statement>
      </didl:Descriptor>
      <didl:Component>
        <didl:Resource mimeType="text" ref="https://eprints.amikom.ac.id/id/eprint/31772/1/24.55.1583%20Ero%20Wahyu%20Pratomo.pdf"/>
      </didl:Component>
    </didl:Item>
    <didl:Item>
      <didl:Descriptor>
        <didl:Statement mimeType="application/xml">
          <dip:ObjectType>info:eu-repo/semantics/humanStartPage</dip:ObjectType>
        </didl:Statement>
      </didl:Descriptor>
      <didl:Component>
        <didl:Resource mimeType="application/html" ref="https://eprints.amikom.ac.id/id/eprint/31772/"/>
      </didl:Component>
    </didl:Item>
  </didl:Item>
</didl:DIDL>