Proyecto de investigadores del grupo Biomedical Computer Vision de Uniandes y de Google Research fue aceptado como presentación oral en la conferencia ICCV 2021, que se realizó de forma virtual del 11 al 17 de octubre de 2021.
ICCV es una de las conferencias en Visión por Computador más importantes del mundo, “este es el éxito académico más grande que ha alcanzado mi grupo desde que llegué, pues la tasa de aceptación para presentaciones orales es del 3%”, afirma el profesor Pablo Arbeláez, director del grupo BCV.
El proyecto con el que se presentó el grupo se titula Panoptic Narrative Grounding, está liderado por la estudiante doctoral Cristina González y en el cual participan los investigadores Jordi Pont-Tuset (Google Research), Nicolás Ayobi, Isabela Hernández, José Hernández y Pablo Arbeláez (BCV-Uniandes).
Muchas de las tareas que realizamos como seres humanos involucran la interacción de la visión y el lenguaje. La idea del proyecto es establecer una base experimental para estudiar el problema de grounding visual (encontrar automáticamente las regiones en la imagen que se indican con expresiones de lenguaje natural) de forma más detallada. “En este proyecto generamos una base de datos para el estudio de esta tarea, métricas de evaluación cuantitativa y un método como línea de base para promover la investigación en este problema”, explica Cristina González.
El objetivo principal de este proyecto es promover y avanzar en la investigación en los problemas en la intersección de la Visión por Computador y el Procesamiento del Lenguaje Natural. Esto permitirá el desarrollo de productos en los que se utilice esta tecnología. Por ejemplo, será posible construir asistentes robóticos con los cuales podamos interactuar utilizando lenguaje natural. Estos asistentes pueden ser desarrollados para tareas de la vida diaria o como asistentes quirúrgicos.