Speech Emotion Recognition

DiegoHDMGZ · Mensaje por **DiegoHDMGZ** » 03 Mar 2021, 22:07

Tema: Speech Emotion Recognition
Integrantes :
- Hans Martin Acha Carranza
- Diego Hurtado de Mendoza González Zúñiga
- Jair Puican Cuadros
Resumen: El presente trabajo consiste en la elaboración de un algoritmo para el reconocimiento de 4 emociones (molesto, triste, feliz, neutral) a través de audio y plasmarlo en un aplicativo web. Extraeremos las características acústicas representadas por el espectrograma del audio transformado en imagen. Esa imagen la utilizaremos como input a una red neuronal convolucional con la arquitectura ResNet34. Compararemos los resultados en 2 datasets: RAVDESS y un dataset propio.
Paper:
Pasos para el desarrollo del trabajo:
- Documentación:
- Librerías para el pip install:
Video presentación del trabajo:
PPT:

G3_Presentacion_Speech Emotion Recognition.pptx

(2.83 MiB) Descargado 134 veces
Código fuente: Repositorio Github
Dataset: Dataset en Github