Si alguna vez has hablado con la gente de Tangram Vision, es probable que te hayas ido con un mayor conocimiento sobre el estado de la percepción para la robótica. El equipo de esta startup con sede en Boulder, Colorado, tiene más de 60 años de experiencia combinada en percepción y sensores.

Fundada en 2020, ha desarrollado un conjunto de herramientas para ayudar a los robóticos a resolver problemas de percepción como la calibración de sensores multimodales, la fusión de sensores y el tiempo de actividad del sensor. Y ahora se está aventurando por primera vez en el hardware de percepción robótica con un sensor de profundidad 3D llamado HiFi que también incorpora una potente inteligencia artificial.
HiFi se lanzó en Kickstarter con la posibilidad de que los primeros patrocinadores puedan obtener un HiFi por $349, lo cual supone un 36% de descuento sobre el precio minorista de $549. Tangram superó su objetivo de $25,000 cuatro horas después de su lanzamiento; al momento de la publicación, la campaña había recaudado más de $40,000. Tangram espera enviar las primeras unidades de HiFi en abril de 2024.
El equipo de Tangram Vision se originó en Occipital, la empresa de computación espacial que lanzó el sensor 3D Structure Sensor con una campaña de Kickstarter de $1.3 millones en 2013.
"Las herramientas para la robótica y la inteligencia artificial han avanzado mucho en los últimos años, pero los sensores no han seguido el ritmo", dijo Brandon Minor, CEO de Tangram Vision. "Después de hablar con cientos de ingenieros de robótica e inteligencia artificial, sabíamos que querían pasar menos tiempo luchando con los sensores y más tiempo construyendo productos geniales. HiFi hace que sea muy sencillo añadir datos 3D mejorados con IA a los robots y más cosas."
Un sensor 3D HiFi montado en un brazo de cobot de Universal Robots. Fuente: Tangram Vision

Capacidades de HiFi
HiFi utiliza cámaras ams Mira220. Combina un par estéreo IR con obturador global de 2 megapíxeles y un campo de visión de 136°, con una cámara RGB de 2 megapíxeles y un campo de visión de 136°, junto con dos proyectores activos. Una línea de base de 65 mm proporciona profundidad desde 0.3 m hasta 5 m con 30-60 fotogramas por segundo. Debido a su campo de visión, Tangram afirmó que los robóticos pueden reemplazar dos sensores de profundidad por un único HiFi en muchas aplicaciones.
HiFi incluye una serie de software, controladores y herramientas integradas para los robóticos.
Por ejemplo, está diseñado para trabajar de forma nativa con ROS 2. Viene con 8 TOPS de potencia de procesamiento de aprendizaje automático que permite la fusión en el sensor de datos AI y 3D. También cuenta con 8GB de memoria a bordo que Tangram dijo que permite ejecutar redes neuronales a bordo de HiFi.
Cuenta con un procesador de profundidad dedicado en el chip Jacinto de Texas Instruments (TI). Tangram dijo que el procesador Jacinto permite a HiFi ofrecer compatibilidad con la Biblioteca de Aprendizaje Profundo de TI, que incluye modelos listos para implementar para la segmentación de escenas, estimación de postura, identificación de objetos, seguimiento de objetos y más. HiFi también está equipado con herramientas de software de sensores de Tangram, como autocalibración, sincronización de tiempo y gestión del tiempo de actividad.

Aplicaciones de robótica
Tangram le dijo a The Robot Report que nunca tuvo la intención de desarrollar un sensor 3D. Pero dijo que se vio obligado a hacerlo después de que muchos de sus clientes de robótica expresaron su decepción con el estado de la detección 3D.
"En este momento, los ingenieros de robótica deben elegir entre la calidad de datos en 3D, las capacidades de IA o la confiabilidad. Pero realmente desean tener las tres cosas", dijo Minor.
En un testimonio para la campaña de HiFi, Nathan Brooks, CTO de PickNik, aparentemente estuvo de acuerdo. Dijo que su empresa ha estado "hablando con Tangram durante años y compartiendo algunas de nuestras dificultades al implementar aplicaciones robóticas en el mundo real y en entornos no estructurados".
Rodnitzky dijo que la robótica móvil ha sido históricamente el pan y mantequilla de Tangram. Pero dijo que HiFi permitirá a la empresa trabajar con diferentes tipos de robots y aplicaciones.
"Las aplicaciones de recolección de objetos no tenían sentido para nosotros antes, pero ahora sí lo tienen", dijo. "Esto podría permitirnos también entrar en la automatización industrial, donde Zivid, IDS y Cognex han dominado con sensores más caros".
Oportunidad de mercado
Para entender la oportunidad que Tangram visualiza para HiFi, basta con mirar la volatilidad del mercado de sensores de profundidad en los últimos años. El Kinect era una opción sólida en su momento, pero eso terminó cuando Apple adquirió PrimeSense por $360 millones en 2013. Google cerró Project Tango a fines de 2017 después de tres años prometedores. E Intel estuvo a punto de cerrar su división RealSense antes de seguir presentando nuevos sensores de profundidad.
Tangram no cuenta con la misma escala que esas compañías mencionadas anteriormente. Pero Minor no cree que eso sea un problema.
"No sé si la gente confía en esos jugadores más grandes. También hay riesgo en eso", dijo. "No tenemos tantas bocas que alimentar, y esto podría ser revolucionario para la industria y nuestra empresa".
Minor también dijo que vender HiFi es una oportunidad para que Tangram introduzca sus servicios de calibración y su modelo de ingresos recurrentes a empresas que nunca antes habían oído hablar de ellos.
"Lanzamos Tangram para reducir las barreras de entrada a la visión por computadora", dijo Minor".
“Por eso comenzamos con la calibración, es una tarea imposible que es muy difícil de hacer. HiFi es una pieza más de ese rompecabezas. Permítanos construir un sensor que cumpla con los estándares de calidad de datos de profundidad y que cuente con increíbles capacidades de procesamiento de IA para realizar procesos sofisticados. Y los robotistas pueden centrarse en las aplicaciones y en lo que hacen bien.