    {
      "uri": "http:\/\/eprints.amikom.ac.id\/id\/eprint\/31772",
      "date": "2026-01-06",
      "creators": [
        {
          "name": {
            "lineage": null,
            "given": "Ero Wahyu",
            "family": "Pratomo",
            "honourific": null
          },
          "nim": "24.55.1583"
        }
      ],
      "date_type": "published",
      "department": "PJJ Magister Teknik Informatika",
      "metadata_visibility": "show",
      "keywords": "TF-IDF, SBERT, E5, Text similarity, Hybrid model, Ground truth,\r\nRepositori akademik, Academic repository",
      "eprint_status": "archive",
      "abstract": "Penelitian ini mengembangkan dan menganalisis performa model hybrid\r\nantara metode TF-IDF dan sentence embedding berbasis transformer (SBERT dan\r\nE5) untuk meningkatkan akurasi pengukuran kemiripan (text similarity) pada\r\ndokumen akademik berbahasa Indonesia. Permasalahan utama yang diangkat\r\nadalah keterbatasan TF-IDF dalam menangkap konteks semantik serta tingginya\r\nbiaya komputasi apabila model embedding diterapkan secara penuh pada repositori\r\nberskala besar (28.575 dokumen).\r\nUntuk mengatasi hal tersebut, penelitian ini mengusulkan arsitektur hybrid\r\ndua tahap: TF-IDF digunakan sebagai filter leksikal agresif dengan lost ratio\r\nsebesar 0,9965 untuk mereduksi ruang pencarian, diikuti oleh reranking semantik\r\nmenggunakan SBERT dan E5. Hasil eksperimen menunjukkan bahwa model\r\nSBERT unggul dalam stabilitas struktur klaster dengan skor ARI tertinggi (0,3444)\r\ndan Davies-Bouldin Index terendah (2,7506), sedangkan E5 unggul dalam aspek\r\nkelengkapan semantik dengan NMI sebesar 0,5183.\r\nDari sisi efisiensi, arsitektur hybrid berhasil memangkas waktu pemrosesan\r\nsecara signifikan. Metode Hybrid TF-IDF + E5 (3,71 detik) terbukti 47,7% lebih\r\ncepat dibandingkan Hybrid TF-IDF + SBERT (7,10 detik). Secara keseluruhan,\r\npendekatan hybrid mampu meningkatkan kualitas similarity dan struktur klaster\r\ndibandingkan penggunaan model tunggal. Model ini terbukti mampu\r\nmenyeimbangkan efisiensi komputasi dan ketepatan semantik, sehingga sangat\r\nrelevan untuk diimplementasikan pada sistem rekomendasi dokumen akademik\r\nberskala besar di repositori institusi.",
      "lastmod": "2026-06-29 03:52:57",
      "ispublished": "pub",
      "title": "ANALISIS KINERJA DAN PENGEMBANGAN MODEL HYBRID TF-IDF \r\nDAN SENTENCE EMBEDDING (SBERT\/E5) UNTUK MENINGKATKAN \r\nAKURASI SIMILARITY TEKS PADA REPOSITORY INSTITUSI \r\nBERBAHASA INDONESIA \r\n(Studi Kasus: eprints.amikom.ac.id)",
      "rev_number": 8,
      "thesis_type": "masters",
      "type": "thesis",
      "userid": 12,
      "corp_creators": [
        "Universitas AMIKOM Yogyakarta"
      ],
      "contributors": [
        {
          "name": {
            "given": "Ema",
            "lineage": null,
            "honourific": null,
            "family": "Utami"
          }
        }
      ],
      "full_text_status": "public",
      "dir": "disk0\/00\/03\/17\/72",
      "divisions": [
        "PJJ"
      ],
      "documents": [
          {
            "security": "public",
            "language": "id",
            "files": [
                {
                  "hash_type": "MD5",
                  "filename": "24.55.1583 Ero Wahyu Pratomo.pdf",
                  "mime_type": "application\/pdf",
                  "mtime": "2026-06-29 02:46:32",
                  "datasetid": "document",
                  "hash": "b4463c449d1653a005ccd938ff4c46ee",
                  "objectid": 319554,
                  "filesize": 3991463,
                  "fileid": 1131314,
                  "uri": "http:\/\/eprints.amikom.ac.id\/id\/file\/1131314"
                }
            ],
            "uri": "http:\/\/eprints.amikom.ac.id\/id\/document\/319554",
            "placement": 1,
            "docid": 319554,
            "mime_type": "application\/pdf",
            "pos": 1,
            "eprintid": 31772,
            "main": "24.55.1583 Ero Wahyu Pratomo.pdf",
            "rev_number": 2,
            "format": "text",
            "content": "published",
            "formatdesc": "THESIS"
          }
      ],
      "eprintid": 31772,
      "institution": "Universitas AMIKOM Yogyakarta",
      "status_changed": "2026-06-29 02:50:34",
      "thesis_name": "tesis",
      "datestamp": "2026-06-29 02:50:34",
      "subjects": [
        "000.000.000A"
      ]
    }