Dr. Caleb Antonio Rascón Estebané

Trabajo Actual

Cierra los ojos. ¿Qué estás escuchando? Tal vez el abanico de tu computadora, o sonidos proviniendo de alguna ventana. Suena tu celular, lo contestas y escuchas: es un amigo preguntándote sobre planes de ir al cine. En eso tu compañero de cuarto te avisa desde la sala que tu programa de televisión favorito está comenzando.

Pudiste discernir entre ruidos (abanico, sonido del entorno) e información relevante (celular, amigo y compañero). Con los ojos cerrados pudiste localizar tu celular y a tu compañero. Además, pudiste reconocer qué o quién estaba produciendo cada sonido.

Esto es lo que Golem, nuestro robot de servicio, está en proceso de hacer. Estoy diseñando un módulo de audio para simular el acto de escucha humano. Esto es también conocido como Análisis de Escenas Auditivas, el cual es una generalización del proyecto Audición Robótica.

Golem anteriormente hacía reconocimiento de lenguaje por medio de un micrófono que estaba en gran cercanía al usuario (diadema). Ahora, el módulo de audio está en proceso de sostenerse sobre un sistema de micrófonos ubicados directamente sobre el robot. Literalmente, le estoy construyendo orejas a Golem.

Hay un curso de posgrado que doy en la UNAM de este tema. Puedes encontrar mayor información aquí. También puedo supervisar diversos proyectos de este tema a diferentes niveles académicos, de los cuales puedes informarte aquí.

Progreso Reciente

  • Integración de estimación de múltiples direcciones de arribo en un esquema de Interacción Humano-Robot.


  • Seguimiento de varios locutores móviles en un ambiente real, utilizando sólo tres micrófonos.


  • Estimación, en tiempo real, la dirección de sonidos en relación al robot, en un rango de 360°, con alta confiabilidad en ambientes medianamente reverberativos.


Trabajo Pendiente

  • Eliminación de reverberación en señales auditivas para el beneficio del reconocimiento de lenguaje.
  • Uso del residuo reverberativo para estimar características del entorno.
  • Separación de fuentes de sonido de la señal auditiva a partir de su dirección en relación al robot.