PENGEMBANGAN CHATBOT TANYA JAWAB UNTUK DOKUMEN MENGGUNAKAN FRAMEWORK LANGCHAIN DAN OPENAI API

Utomo, Galih Waskito (2024) PENGEMBANGAN CHATBOT TANYA JAWAB UNTUK DOKUMEN MENGGUNAKAN FRAMEWORK LANGCHAIN DAN OPENAI API. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (2MB)
[img] Text (BAB I)
BAB I.pdf

Download (271kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (190kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB V)
BAB V.pdf

Download (37kB)
[img] Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf
Restricted to Registered users only

Download (405kB)
[img] Archive (SOURCE CODE)
Sourcecode - 19.11.3232.zip
Restricted to Repository staff only

Download (100kB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (1MB)

Abstract

Penelitian ini mengembangkan sistem chatbot penjawab pertanyaan berbasis dokumen menggunakan LangChain, vektor embedding, dan API OpenAI. Sistem ini memungkinkan pengguna mengunggah dokumen dalam berbagai format (PDF, DOCX, TXT). Konten dokumen diproses, dipecah menjadi bagian kecil, dan disematkan ke dalam vektor berdimensi tinggi dengan model Embeddings OpenAI. Vektor ini disimpan dalam basis data vektor, seperti Pinecone, untuk pencarian semantik yang efisien. Saat pengguna mengajukan pertanyaan terkait dokumen, sistem mencari bagian teks relevan berdasarkan kemiripan vektor dengan embedding pertanyaan. Bagian relevan ini kemudian diteruskan ke model penjawab pertanyaan berbasis GPT-3.5-turbo dari OpenAI untuk menghasilkan jawaban kontekstual. LangChain digunakan untuk menyusun berbagai komponen sistem, sementara API OpenAI mengakses model bahasa dan embedding terbaru. Eksperimen menunjukkan sistem mampu menjawab pertanyaan faktual dengan akurat terkait konten dokumen. Desain modularnya memudahkan integrasi dan penggantian komponen, memungkinkan eksperimen dan peningkatan lebih lanjut. Penelitian ini menunjukkan potensi kombinasi embedding vektor dan model bahasa besar dalam mengembangkan sistem penjawab pertanyaan berbasis dokumen yang efisien.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Huda, Arif Akbarul
Uncontrolled Keywords: Penjawab Pertanyaan Berbasis Dokumen, Chatbot, Langchain, Vektor Embedding, API Openai, Pencarian Semantik, Model Bahasa
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 13 Nov 2024 03:33
Last Modified: 13 Nov 2024 03:33
URI: http://eprints.amikom.ac.id/id/eprint/27995

Actions (login required)

View Item View Item