Arsyad, Mukhlishin M (2025) IMPLEMENTASI KOMBINASI ALGORITMA CNN 1 DAN 2 DIMENSI PADA SPEECH EMOTION RECOGNITION. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.
![]() |
Text (COVER-ABSTRAK)
COVER.pdf Download (1MB) |
![]() |
Text (BAB I)
BAB I.pdf Download (170kB) |
![]() |
Text (BAB II)
BAB II.pdf Restricted to Registered users only Download (576kB) |
![]() |
Text (BAB III)
BAB III.pdf Restricted to Registered users only Download (264kB) |
![]() |
Text (BAB IV)
BAB IV.pdf Restricted to Registered users only Download (309kB) |
![]() |
Text (BAB V)
BAB V.pdf Download (60kB) |
![]() |
Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf Restricted to Registered users only Download (312kB) |
![]() |
Archive (SOURCE CODE)
Sourcecode - 20.11.3325.zip Restricted to Repository staff only Download (94MB) |
![]() |
Text (PUBLIKASI)
Publikasi.pdf Restricted to Repository staff only Download (1MB) |
Abstract
Pengenalan emosi dari ucapan atau biasa disebut Speech Emotion Recognition (SER) adalah salah satu bidang dari kecerdasan buatan yang penelitiannya saat ini sedang berkembang. Penerapan dari teknologi ini cukup luas. Beberapa penelitian telah dilakukan dan memberikan hasil yang signifikan. Namun, teknologi ini memiliki beberapa tantangan yang cukup serius dikarenakan karakteristik suara manusia yang variatif, juga faktor kebisingan atau noise. Selain itu, beberapa hal teknis menjadi tantangan dalam pengembangan teknologi ini seperti pemilihan fitur ekstraksi, augmentation, dan penanganan perbedaan durasi dari dataset yang ada. Oleh karena itu, penelitian ini bertujuan untuk mengimplementasikan Algoritma Convolutional Neural Network (CNN) namun menggunakan pendekatan yang berbeda yaitu dengan menggabungkan hasil ekstraksi 1 dan 2 dimensi dari dataset yang ada. Pada penelitian ini terdapat 3 dataset yang umumnya sudah dipakai oleh beberapa penelitian yang sudah pernah ada sebelumnya. Beberapa dataset itu adalah Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS), The Audio, Speech, and Vision Processing Lab Emotional Sound database (ASVPESD), Toronto emotional speech set (TESS) yang berisi rekaman suara dengan berbagai macam emosi yang sudah dilabeli dengan emosi itu sendiri. Hasil pengujian yang didapatkan setelah dilakukan implementasi dan pengujian dengan CNN 1 dan 2 dimensi didapatkan akurasi mencapai lebih dari 90%
Item Type: | Thesis (S1 - Sarjana) | ||
---|---|---|---|
Contributor: |
|
||
Uncontrolled Keywords: | Pengenalan Emosi Dari Ucapan, Deep Learning, Convolutional Neural Network, Ekstraksi Fitur, Kombinasi Dimensi | ||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus |
||
Divisions: | Fakultas Ilmu Komputer > Informatika | ||
Depositing User: | RC Universitas AMIKOM Yogyakarta | ||
Date Deposited: | 12 Aug 2025 07:32 | ||
Last Modified: | 12 Aug 2025 07:32 | ||
URI: | http://eprints.amikom.ac.id/id/eprint/30282 |
Actions (login required)
![]() |
View Item |