Autores. Jordan Urías & Iván Moreno

La identificación facial es la tecnología de acceso más segura, una solución para el control y asignación de conductores que brinda un alto grado de confiabilidad e higiene en la operación de tu flota.

Uno de los temas más populares en el campo de la Inteligencia Artificial es la Identificación Facial, con el objetivo de construir programas que identifiquen de forma automática quien aparezca frente a una cámara, de la misma manera que lo hace un humano.

En un autobús es muy importante saber quién es el operador que conduce la unidad, por lo que en Didcom® se detectó una valiosa oportunidad para extender las capacidades de los Sensores de Fatiga instalados en algunas unidades.

Al identificar el rostro del operador al frente de la cámara, agregamos un nivel más de confianza y nos aseguramos que la operación está funcionando como se espera.

Al no requerir contacto físico, el reconocimiento facial brinda un método más higiénico que refuerza las acciones de prevención ante la actual situación de pandemia, evitando generar riesgos de contagio en las unidades de transporte.

En todo proyecto de software que implica Machine Learning, siempre existen retos que deben ser superados para llegar a un producto que tenga un verdadero impacto positivo. El reto más importante en este proyecto es la detección de rostros aún cuando las personas usan cubrebocas.

Dado que la información que se busca procesar son fotos de personas, se requiere de un equipo especializado: una cámara equipada con sensores infrarrojos que tienen la capacidad de capturar fotos en condiciones de poca luz, lo que garantiza información de calidad para nuestro propósito.

Una vez que se captura una foto, llega a nuestros servidores y es enviada a una unidad de procesamiento de reconocimiento facial, lo que permite identificar fácilmente el operador en todo momento.

El Problema del Cubrebocas

El hecho de cubrir la mitad del rostro tiende a provocar que los algoritmos de detección facial y la tarea de reconocimiento fallen, por lo que fue necesario definir una ruta de solución más artesanal.

Consideramos importante abordar las limitaciones del algoritmo y el por qué las herramientas accesibles de forma comercial pueden no funcionar durante los tiempos de pandemia.

Las Redes Neuronales Convolucionales

Las redes neuronales convolucionales es un algoritmo de Deep Learning que está diseñado para trabajar con imágenes, pero estos algoritmos son tan efectivos como la información con las que se les entrena.

Una red neuronal, al igual que un bebé, no podría diferenciar entre un hombre con barba y uno sin barba, si nunca ha visto a alguien con barba. Con este ejemplo podemos visualizar mejor la problemática que el uso del cubrebocas implica para las herramientas convencionales.

La información con la que se entrenan los modelos de varios servicios web no contienen gente con cubrebocas, por lo que sus algoritmos no detectan el cubrebocas, por lo tanto no logran detectar un rostro cubierto por uno.

La solución a este reto es reforzar el algoritmo, mostrándole qué es un cubrebocas, cómo se usa y sobre todo, cómo luce una persona con y sin él.

Entrenamiento con Cubrebocas

Si queremos detectar rostros cubiertos con cubrebocas, debemos mostrarle a nuestros algoritmos las fotografías adecuadas. Esta tarea es sencilla, pero lleva tiempo, dado que las fotos de personas portando cubrebocas son poco comunes de encontrar, además de la complejidad que agregan las circunstancias globales actuales.

La solución que definimos es emplear otras herramientas de Machine Learning que nos permiten mejorar nuestras imágenes de dos formas:

  • Agregar cubrebocas ficticios
  • Integrar rotación a los resultados

Las herramientas detectan posiciones claves de la cara como cejas, puente de la nariz y boca, para posteriormente ajustar el ángulo y la posición de un cubrebocas ficticio.

Una vez que tenemos las fotos con cubrebocas, podemos empezar a rotarlas ligeramente para crear un conjunto más grande de imágenes con una más amplia variedad de ángulos que el algoritmo pueda analizar.

Así le brindamos apoyo a la Red Neuronal para que logre identificar los rostros correctamente, aún cuando las condiciones no sean perfectas, como situaciones de poca luz.

Conclusión

Las soluciones que integramos en Didcom® son el resultado de fusionar el potencial de la tecnología y nuestro conocimiento y experiencia. Para lograr superar los nuevos desafíos de la pandemia por Covid-19 las Empresas de Autotransporte requieren de servicios que les permitan mantenerse competitivas, garantizando la seguridad de su personal y la rentabilidad de su operación.

Acerca de los autores

LCC. Jordan Urías / Ciencia de Datos / Ingeniería de Datos

LCC. Iván Moreno / Ciencia de Datos / Analista de Datos

Equipo de Big Data en Didcom®, a cargo de investigar y desarrollar software que permita recopilar y analizar información para crear productos de datos que agreguen valor a las operaciones de nuestros clientes.