Investigadores del SIANI-ULPGC proponen un novedoso modelo de reconocimiento automático de personas
El grupo de Inteligencia Artificial, Robótica y Oceanográfica Computacional (iROC) del Instituto Universitario de Sistemas Inteligentes y Aplicaciones Numéricas en Ingeniería (SIANI), ganó la Competición Internacional de la Conference on Computer Analysis of Images and Patterns (CAIP), el pasado mes de septiembre.
El equipo iROC-ULPGC del Instituto SIANI, liderado por el catedrático Modesto Castrillón y en colaboración con la investigadora Elena Sánchez de la Universidad de La Laguna (ULL), ha ganado en septiembre la Competición Internacional Contest on Pedestrian Attribute Recognition (reconocimiento automático de características de personas) en el marco de la vigésima edición del Congreso Internacional de Análisis Informático de Imágenes y Patrones, celebrado en Chipre.
El grupo de investigadores de la ULPGC presentó una propuesta novedosa para realizar el reconocimiento y descripción automática de seres humanos, en función de sus rasgos y atributos, basado en un “sistema entrenado para responder varias preguntas, al estilo de los prompts, tan de moda desde el ChatGPT”, explica Modesto Castrillón.
El modelo de lenguaje utilizado por los investigadores de la ULPGC, BLIP-2 como sistema Visual Question Answering (VQA), ha permitido realizar combinaciones de preguntas sobre imágenes, con el fin de resolver múltiples tareas de descripción de personas. “Es un enfoque innovador pues se han obtenido resultados espectaculares para resolver diversos problemas en la comunidad científica, pero no teníamos constancia de que pudiera funcionar bien para describir personas”, ha destacado el catedrático de la ULPGC. La competición internacional en la que han resultado ganadores ha supuesto, por tanto, “una estupenda piedra de toque para evaluarlo, dado que hemos contado con más de 100.000 imágenes de personas para probarlo y constatar lo fiable que puede ser”.
Estos modelos de reconocimiento de personas son especialmente útiles en el sector de la videovigilancia y la seguridad. El sistema automático de descripción de personas permite que las cámaras de vigilancia puedan reconocer o buscar entre sus imágenes, y en pocos minutos, a un individuo con determinadas características, gracias a modelos computacionales como el BLIP-2 VQA, adiestrados con imágenes y decenas de miles de preguntas sobre éstas. “De este modo, es un sistema muy útil para localizar a sospechosos en distintos lugares o a personas perdidas”, explica el investigador de la ULPGC. “Del mismo modo, podemos desarrollar programas donde un robot interactúa con la persona que aparece en una imagen, halagándole su estilo, aconsejándole algo en particular sobre su vestuario en función del tiempo atmosférico, o comentando el significado de algunas de las prendas que está usando”.
Los investigadores de la ULPGC que han participado en este concurso, bajo la dirección de Modesto Castrillón, son David Freire, Daniel Hernández, Javier Lorenzo y Oliverio Santana. Todos ellos forman parte, además, del Proyecto ILUSOS en el que actualmente está inmersa la ULPGC con la Universidad del País Vasco, y que se basa en la identificación de personas y el análisis de datos multimodal, en el ámbito de la robótica social.
MIT Por qué 2020 fue contradictorio para reconocimiento Facial
Biometría facial , identificación social en apoyo a las ONGs