IMPLEMENTASI KOMBINASI ALGORITMA CNN 1 DAN 2 DIMENSI PADA SPEECH EMOTION RECOGNITION

Arsyad, Mukhlishin M (2025) IMPLEMENTASI KOMBINASI ALGORITMA CNN 1 DAN 2 DIMENSI PADA SPEECH EMOTION RECOGNITION. S1 - Sarjana thesis, Universitas AMIKOM Yogyakarta.

[img] Text (COVER-ABSTRAK)
COVER.pdf

Download (1MB)
[img] Text (BAB I)
BAB I.pdf

Download (170kB)
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (576kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (264kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (309kB)
[img] Text (BAB V)
BAB V.pdf

Download (60kB)
[img] Text (DAFTAR PUSTAKA-LAMPIRAN)
Daftar Pustaka dan Lampiran.pdf
Restricted to Registered users only

Download (312kB)
[img] Archive (SOURCE CODE)
Sourcecode - 20.11.3325.zip
Restricted to Repository staff only

Download (94MB)
[img] Text (PUBLIKASI)
Publikasi.pdf
Restricted to Repository staff only

Download (1MB)

Abstract

Pengenalan emosi dari ucapan atau biasa disebut Speech Emotion Recognition (SER) adalah salah satu bidang dari kecerdasan buatan yang penelitiannya saat ini sedang berkembang. Penerapan dari teknologi ini cukup luas. Beberapa penelitian telah dilakukan dan memberikan hasil yang signifikan. Namun, teknologi ini memiliki beberapa tantangan yang cukup serius dikarenakan karakteristik suara manusia yang variatif, juga faktor kebisingan atau noise. Selain itu, beberapa hal teknis menjadi tantangan dalam pengembangan teknologi ini seperti pemilihan fitur ekstraksi, augmentation, dan penanganan perbedaan durasi dari dataset yang ada. Oleh karena itu, penelitian ini bertujuan untuk mengimplementasikan Algoritma Convolutional Neural Network (CNN) namun menggunakan pendekatan yang berbeda yaitu dengan menggabungkan hasil ekstraksi 1 dan 2 dimensi dari dataset yang ada. Pada penelitian ini terdapat 3 dataset yang umumnya sudah dipakai oleh beberapa penelitian yang sudah pernah ada sebelumnya. Beberapa dataset itu adalah Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS), The Audio, Speech, and Vision Processing Lab Emotional Sound database (ASVPESD), Toronto emotional speech set (TESS) yang berisi rekaman suara dengan berbagai macam emosi yang sudah dilabeli dengan emosi itu sendiri. Hasil pengujian yang didapatkan setelah dilakukan implementasi dan pengujian dengan CNN 1 dan 2 dimensi didapatkan akurasi mencapai lebih dari 90%

Item Type: Thesis (S1 - Sarjana)
Contributor:
Pembimbing
Huda, Arif Akbarul
Uncontrolled Keywords: Pengenalan Emosi Dari Ucapan, Deep Learning, Convolutional Neural Network, Ekstraksi Fitur, Kombinasi Dimensi
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 006 Metode komputer khusus
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: RC Universitas AMIKOM Yogyakarta
Date Deposited: 12 Aug 2025 07:32
Last Modified: 12 Aug 2025 07:32
URI: http://eprints.amikom.ac.id/id/eprint/30282

Actions (login required)

View Item View Item