COMPRESSION CHARACTERISTIC OF LLM USING PRUNING METHODS ON EDGE DEVICE

Kemadi, Sultan Gemilang (2025) COMPRESSION CHARACTERISTIC OF LLM USING PRUNING METHODS ON EDGE DEVICE. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (1MB)
[img] Text (BAB I)
BAB I.pdf

Download (135kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (787kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (399kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (794kB)
[img] Text (BAB V)
BAB V.pdf

Download (89kB)
[img] Text (DAFTAR PUSTAKA)
Daftar Pustaka.pdf
Restricted to Registered users only

Download (226kB)
[img] Archive (SOURCE CODE)
Sourcecode - 21.11.4303.zip
Restricted to Repository staff only

Download (8MB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (2MB)

Abstract

Dengan perkembangan terbaru dalam Large Language Models (LLM), kita telah menyaksikan peningkatan akurasi dan performa dalam berbagai tugas. Meskipun terjadi peningkatan tersebut, masih terdapat beberapa masalah terkait sumber daya komputasi, penggunaan memori, dan konsumsi energi. Masalah-masalah ini membatasi penggunaan praktis pada perangkat dengan sumber daya terbatas, seperti edge device. Untuk mengatasi hal ini, teknik kompresi model, khususnya metode pruning, telah mendapat perhatian sebagai solusi yang efektif. Studi ini mengeksplorasi dampak dari berbagai pendekatan pruning terhadap LLM. Melalui evaluasi eksperimental, kami meneliti karakteristik efek pruning terhadap latensi inferensi, metrik performa, dan konsumsi daya. Studi kami menyoroti tiga temuan utama: (1) Meskipun pruning dapat secara signifikan mempercepat inferensi, hasil latensi menunjukkan variasi yang besar, yang dapat menyebabkan peningkatan variabilitas dan meningkatkan latensi TTFT tergantung pada input, sehingga dapat berdampak pada responsivitas waktu nyata; (2) Pruning dapat mengurangi penggunaan perangkat keras hingga 10% dan konsumsi daya hingga 14%, yang menunjukkan komputasi yang lebih efisien; dan (3) Pruning pada model yang lebih besar lebih efektif dibandingkan dengan pruning pada model yang sudah kecil. Temuan-temuan ini diharapkan dapat memberikan wawasan berharga untuk mengoptimalkan penerapan LLM di lingkungan dengan keterbatasan sumber daya serta meningkatkan metode pruning di kedepannya.

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Setyanto, Arief
Uncontrolled Keywords: LLMs, Edge Device, Kompresi, Pruning, Karakteristik
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 01 Dec 2025 06:59
Last Modified: 01 Dec 2025 06:59
URI: http://eprints.amikom.ac.id/id/eprint/31405

Actions (login required)

View Item View Item