Dr. Caleb Antonio Rascón Estebané

Trabajo Actual

Cierra los ojos. ¿Qué estás escuchando? Tal vez el abanico de tu computadora, o sonidos proviniendo de alguna ventana. Suena tu celular, lo contestas y escuchas: es un amigo preguntándote sobre planes de ir al cine. En eso tu compañero de cuarto te avisa desde la sala que tu programa de televisión favorito está comenzando.

Pudiste discernir entre ruidos (abanico, sonido del entorno) e información relevante (celular, amigo y compañero). Con los ojos cerrados pudiste localizar tu celular y a tu compañero. Además, pudiste reconocer qué o quién estaba produciendo cada sonido.

Esto es lo que pretendo que haga un robot como el del Grupo Golem con el que colaboro. Estoy diseñando un módulo de audio para simular el acto de escucha humano. Esto es también conocido como Análisis de Escenas Auditivas, el cual es una generalización del proyecto Audición Robótica.

Robots típicamente llevan a cabo reconocimiento de lenguaje por medio de un micrófono que está en gran cercanía al usuario (diadema) o sufren de pobre desempeño. La idea es que el software de audio recaude información auditiva de un arreglo de micrófonos montados directamente sobre el robot y que en conjunto actúen como su sistema auditivo. Literalmente, estoy construyendo orejas a robots.

Hay un curso de posgrado que doy en la UNAM de este tema. Puedes encontrar mayor información aquí. También puedo supervisar diversos proyectos de este tema a diferentes niveles académicos, de los cuales puedes informarte aquí.

Progreso Reciente

Integración de estimación de múltiples direcciones de arribo en un esquema de Interacción Humano-Robot.

Seguimiento de varios locutores móviles en un ambiente real, utilizando sólo tres micrófonos.

Estimación, en tiempo real, la dirección de sonidos en relación al robot, en un rango de 360°, con alta confiabilidad en ambientes medianamente reverberativos.

Trabajo Pendiente

Eliminación de reverberación en señales auditivas para el beneficio del reconocimiento de lenguaje.
Uso del residuo reverberativo para estimar características del entorno.
Separación de fuentes de sonido de la señal auditiva a partir de su dirección en relación al robot.