Desarrollan herramienta para clasificar y buscar imágenes en archivos electrónicos a partir de información visual

Un equipo internacional de investigadores desarrolló una técnica informática que realiza búsquedas y clasificaciones de videos y fotos a partir de parámetros visuales. De acuerdo con uno de sus artífices, Manuel Jesús Marín Jiménez, de la Universidad española de Córdoba, este tipo de técnicas puede emplearse para buscar y clasificar de manera automática secuencias de vídeo en archivos de equipos domésticos como en aplicaciones profesionales, por ejemplo, en empresas de televisión.

(Agencia CyTA – Instituto Leloir)-. En la actualidad la búsqueda y clasificación de archivos que se guardan en las computadoras se realiza a partir de su nombre, del tamaño o de la fecha, entre otras características, pero un trabajo pionero dio lugar a un software que permite clasificar fotos, imágenes o videos según determinados atributos.

“Hemos desarrollado técnicas informáticas que permiten clasificar fotografías y secuencias de vídeo en función de las categorías de objetos que aparecen en ellas. Para ello sólo usamos la información visual contenida en ellas, nada de fecha, ni palabras clave”, señaló a la Agencia CyTA uno de sus creadores, Manuel Jesús Marín Jiménez, profesor del Departamento de Informática y Análisis Numérico de la Universidad española de Córdoba. En el desarrollo de esta técnica informática también participaron investigadores de la Universidad de Granada, en España, de la Universidad de Oxford, Reino Unido, y del Instituto ETH de Zurich, Suiza.

El software desarrollado permite clasificar y encontrar los archivos de acuerdo con la información visual que contienen, por ejemplo, características físicas o movimientos realizados por personas que figuran en los videos. “Actualmente el resultado más destacable es el de un detector de upper-body (cabeza y hombros) de personas, que se usa principalmente en secuencias de vídeo de películas o televisión, donde la mayor parte del tiempo no todo el cuerpo es visible. Posteriormente, usamos la región definida por el detector para estimar la localización y orientación de los miembros superiores del cuerpo (cabeza, tronco, brazos y antebrazos)”, explica Marín Jiménez. Y agrega: “Este tipo de técnicas tienen cabida tanto en aplicaciones de PC para que un usuario clasifique o haga búsquedas en sus colecciones fotográficas, como en aplicaciones profesionales de empresas de televisión para clasificación y búsqueda automática de secuencias de vídeo en sus archivos.”

Una técnica de gran utilidad

En la actualidad, Marín Jiménez y sus colegas desarrollan prototipos de investigación que son evaluados sobre enormes bases de datos de imágenes usadas por la comunidad científica del campo de la visión por computador. “Nuestra intención, al día de hoy, no es comercializarlo como un producto software de usuario final, sino poner la técnica a disposición para que sea usada como complemento en otras posibles aplicaciones”, destaca el investigador español. De acuerdo con Marín Jiménez, mediante el empleo de estas técnicas no sería tan necesaria la intervención de un experto humano que etiquetase con palabras clave todas y cada una de las secuencias de vídeo de un programa televisivo, entre otros casos.

“Otro ejemplo clásico es la búsqueda de vídeos en sitios web como YouTube, donde ésta se realiza mediante el título del vídeo o los comentarios y tags introducidos por los usuarios”, subraya Marín Jiménez y concluye: “Sin embargo, este problema no puede considerarse aún como resuelto, aunque nosotros hemos aportado un granito de arena en su resolución.”

noticias relacionadas