Autores. Jordan Urías & Iván Moreno
Uno de los temas más populares en el campo de la Inteligencia Artificial es la Identificación Facial, con el objetivo de construir programas que identifiquen de forma automática quien aparezca frente a una cámara, de la misma manera que lo hace un humano.
En un autobús es muy importante saber quién es el operador que conduce la unidad, por lo que en Didcom® se detectó una valiosa oportunidad para extender las capacidades de los Sensores de Fatiga instalados en algunas unidades.
Al identificar el rostro del operador al frente de la cámara, agregamos un nivel más de confianza y nos aseguramos que la operación está funcionando como se espera.
En todo proyecto de software que implica Machine Learning, siempre existen retos que deben ser superados para llegar a un producto que tenga un verdadero impacto positivo. El reto más importante en este proyecto es la detección de rostros aún cuando las personas usan cubrebocas.
Dado que la información que se busca procesar son fotos de personas, se requiere de un equipo especializado: una cámara equipada con sensores infrarrojos que tienen la capacidad de capturar fotos en condiciones de poca luz, lo que garantiza información de calidad para nuestro propósito.
Una vez que se captura una foto, llega a nuestros servidores y es enviada a una unidad de procesamiento de reconocimiento facial, lo que permite identificar fácilmente el operador en todo momento.
El hecho de cubrir la mitad del rostro tiende a provocar que los algoritmos de detección facial y la tarea de reconocimiento fallen, por lo que fue necesario definir una ruta de solución más artesanal.
Consideramos importante abordar las limitaciones del algoritmo y el por qué las herramientas accesibles de forma comercial pueden no funcionar durante los tiempos de pandemia.
Las redes neuronales convolucionales es un algoritmo de Deep Learning que está diseñado para trabajar con imágenes, pero estos algoritmos son tan efectivos como la información con las que se les entrena.
Una red neuronal, al igual que un bebé, no podría diferenciar entre un hombre con barba y uno sin barba, si nunca ha visto a alguien con barba. Con este ejemplo podemos visualizar mejor la problemática que el uso del cubrebocas implica para las herramientas convencionales.
La información con la que se entrenan los modelos de varios servicios web no contienen gente con cubrebocas, por lo que sus algoritmos no detectan el cubrebocas, por lo tanto no logran detectar un rostro cubierto por uno.
La solución a este reto es reforzar el algoritmo, mostrándole qué es un cubrebocas, cómo se usa y sobre todo, cómo luce una persona con y sin él.
Si queremos detectar rostros cubiertos con cubrebocas, debemos mostrarle a nuestros algoritmos las fotografías adecuadas. Esta tarea es sencilla, pero lleva tiempo, dado que las fotos de personas portando cubrebocas son poco comunes de encontrar, además de la complejidad que agregan las circunstancias globales actuales.
La solución que definimos es emplear otras herramientas de Machine Learning que nos permiten mejorar nuestras imágenes de dos formas:
Las herramientas detectan posiciones claves de la cara como cejas, puente de la nariz y boca, para posteriormente ajustar el ángulo y la posición de un cubrebocas ficticio.
Una vez que tenemos las fotos con cubrebocas, podemos empezar a rotarlas ligeramente para crear un conjunto más grande de imágenes con una más amplia variedad de ángulos que el algoritmo pueda analizar.
Así le brindamos apoyo a la Red Neuronal para que logre identificar los rostros correctamente, aún cuando las condiciones no sean perfectas, como situaciones de poca luz.
Las soluciones que integramos en Didcom® son el resultado de fusionar el potencial de la tecnología y nuestro conocimiento y experiencia. Para lograr superar los nuevos desafíos de la pandemia por Covid-19 las Empresas de Autotransporte requieren de servicios que les permitan mantenerse competitivas, garantizando la seguridad de su personal y la rentabilidad de su operación.
Equipo de Big Data en Didcom®, a cargo de investigar y desarrollar software que permita recopilar y analizar información para crear productos de datos que agreguen valor a las operaciones de nuestros clientes.
LCC. Jordan Urías / Ciencia de Datos / Ingeniería de Datos
LCC. Iván Moreno / Ciencia de Datos / Analista de Datos
Últimos Blogs
Temas de interés