COMPRESSION CHARACTERISTIC OF LLM USING PRUNING METHODS ON EDGE DEVICE

Kemadi, Sultan Gemilang (2025) COMPRESSION CHARACTERISTIC OF LLM USING PRUNING METHODS ON EDGE DEVICE. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

	Text (COVER-ABSTRAK) COVER.pdf Download (1MB)
	Text (BAB I) BAB I.pdf Download (135kB)
	Text (BAB II) BAB II.pdf Restricted to Registered users only Download (787kB)
	Text (BAB III) BAB III.pdf Restricted to Registered users only Download (399kB)
	Text (BAB IV) BAB IV.pdf Restricted to Registered users only Download (794kB)
	Text (BAB V) BAB V.pdf Download (89kB)
	Text (DAFTAR PUSTAKA) Daftar Pustaka.pdf Restricted to Registered users only Download (226kB)
	Archive (SOURCE CODE) Sourcecode - 21.11.4303.zip Restricted to Repository staff only Download (8MB)
	Text (PUBLIKASI) Publikasi.pdf Restricted to Repository staff only Download (2MB)

Abstract

Dengan perkembangan terbaru dalam Large Language Models (LLM), kita telah menyaksikan peningkatan akurasi dan performa dalam berbagai tugas. Meskipun terjadi peningkatan tersebut, masih terdapat beberapa masalah terkait sumber daya komputasi, penggunaan memori, dan konsumsi energi. Masalah-masalah ini membatasi penggunaan praktis pada perangkat dengan sumber daya terbatas, seperti edge device. Untuk mengatasi hal ini, teknik kompresi model, khususnya metode pruning, telah mendapat perhatian sebagai solusi yang efektif. Studi ini mengeksplorasi dampak dari berbagai pendekatan pruning terhadap LLM. Melalui evaluasi eksperimental, kami meneliti karakteristik efek pruning terhadap latensi inferensi, metrik performa, dan konsumsi daya. Studi kami menyoroti tiga temuan utama: (1) Meskipun pruning dapat secara signifikan mempercepat inferensi, hasil latensi menunjukkan variasi yang besar, yang dapat menyebabkan peningkatan variabilitas dan meningkatkan latensi TTFT tergantung pada input, sehingga dapat berdampak pada responsivitas waktu nyata; (2) Pruning dapat mengurangi penggunaan perangkat keras hingga 10% dan konsumsi daya hingga 14%, yang menunjukkan komputasi yang lebih efisien; dan (3) Pruning pada model yang lebih besar lebih efektif dibandingkan dengan pruning pada model yang sudah kecil. Temuan-temuan ini diharapkan dapat memberikan wawasan berharga untuk mengoptimalkan penerapan LLM di lingkungan dengan keterbatasan sumber daya serta meningkatkan metode pruning di kedepannya.

Item Type:

Thesis (S1 - Sarjana)

Contributor:

Pembimbing
Setyanto, Arief

Uncontrolled Keywords:

LLMs, Edge Device, Kompresi, Pruning, Karakteristik

Subjects:

000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data

Divisions:

Fakultas Ilmu Komputer > Informatika

Depositing User:

RC Universitas AMIKOM Yogyakarta

Date Deposited:

01 Dec 2025 06:59

Last Modified:

01 Dec 2025 06:59

URI:

http://eprints.amikom.ac.id/id/eprint/31405

Actions (login required)

View Item