Pasar al contenido principal
Resultados del algoritmo ByteTrack para reconocimiento de objetos ocultos

Visión artificial: un nuevo algoritmo permite el reconocimiento de objetos ocultos

Un nuevo algoritmo, bautizado como ByteTrack, promete revolucionar el campo de la visión artificial. ¿Pero qué es lo que hace ByteTrack?. 

Este algoritmo permite resolver un problema característico en el seguimiento de objetos múltiples, un campo que busca identificar objetos en vídeos utilizando recuadros que permitan delimitar dichos objetos. El seguimiento de objetos múltiples  fue desarrollado inicialmente por Zenon Pylyshyn para apoyar su teoría acerca del mecanismo perceptivo que utilizamos los humanos para enfocar nuestra atención en los elementos más llamativos de una escena visual y seguirlos en el tiempo y el espacio. 

Las técnicas que se han venido utilizado tradicionalmente para este fin se encontraban con el problema de cómo hacer el seguimiento de objetos que son ocultados por otros. El nuevo algoritmo propuesto permite resolver este problema. 

En la imagen podemos ver la diferencia entre aplicar un algoritmo tradicional y aplicar ByteTrack: 

  • En la fila superior se muestran los recuadros delimitadores correspondientes a todas las personas de la escena. En el tercer frame vemos cómo baja la prioridad asignada al recuadro de la persona que es ocultada parcialmente por la transeúnte que aparece en primer plano.
  • En la segunda fila vemos el resultado de aplicar algoritmos tradicionales de seguimiento de objetos: sólo se tienen en cuenta los recuadros con prioridad alta. El resultado es que los objetos ocultados no se toman en consideración. 
  • En la tercera fila vemos el resultado de aplicar el nuevo algoritmo ByteTrack: se detecta correctamente a la persona del fondo incluso en aquellos frames donde está parcialmente oculta. 

Este nuevo método propuesto en un artículo elaborado de manera conjunta por investigadores de la universidad de Hong Kong, Huazhong University of Science and Technology y ByteDance supone un importante avance en el estado del arte del campo de la visión artificial, tan importante para aplicaciones de gran interés como por ejemplo la conducción autónoma.  

 

 

Etiquetas