Charla: “Procesamiento audio-visual de señales de voz”


Compartir
Charlista: 
Dr. Lucas Terissi, Investigador CIFASIS-CONICET, Rosario, Argentina
Fecha: 
7 Octubre, 2016 - 10:30
Sala: 
Sala Auditorio Philippe Flajolet, 3er piso, Edif. Poniente
Organización: 
Prof. Nancy Hitschfeld

Resumen:

La comunicación entre humanos es por naturaleza multi-modal, predominantemente bimodal (audio-visual), en el sentido que son de fundamental importancia tanto la información acústica de la señal emitida por la persona que está hablando, como la información visual de los gestos que esa persona está realizando. En particular, la información visual del movimiento de labios, y otros músculos faciales posibilita una mejor comprensión del mensaje que se quiere transmitir.  Por tal motivo, en las últimas dos décadas ha habido un creciente interés en el estudio, desarrollo e implementación de nuevas tecnologías que utilicen información audio-visual. Durante esta charla se abordará el problema de representación y modelado de información audio-visual relacionada con el habla. En particular, se describirán métodos de procesamiento audio-visual de señales de voz para la extracción de características de la señal de voz y de la expresión facial, así como para el modelado de la información audio-visual para su uso en aplicaciones de animación de modelos de rostro virtuales y de reconocimiento del habla.