Skip to main content

En el proyecto CAPSUL-IA no solo buscamos facilitar el despliegue de modelos de Inteligencia Artificial en la industria, sino garantizar que estos sistemas funcionen de forma estable, eficiente y controlada una vez se lleven a producción. En entornos industriales reales donde los recursos son limitados y la disponibilidad del sistema es crítica, no basta con que un modelo funcione, sino que además es imprescindible poder supervisar su comportamiento y el de la infraestructura que lo soporta.

Dado que las cápsulas de IA están diseñadas para operar en plataformas con distintos niveles de capacidad y exigencia, resulta fundamental contar con un stack de herramientas que permita supervisar su comportamiento de forma constante, garantizando su fiabilidad, eficiencia y continuidad operativa en entornos industriales.

Arquitectura de monitorización y observabilidad

Desde ZYLK hemos trabajado en el diseño e implantación de una arquitectura de monitorización y observabilidad que permite supervisar en tiempo real el estado de las cápsulas desplegadas en las distintas plataformas hardware del proyecto.

La solución se basa en tecnologías ampliamente consolidadas en el marco DevOps:

  • Cadvisor: obtiene métricas detalladas de los contenedores Docker donde se ejecutan las cápsulas.
  • Node Exporter: obtiene métricas que proporcionan información del estado global del sistema, incluyendo el uso de CPU, memoria, almacenamiento y red.
  • Systemd Exporter: proporciona información sobre el estado de los servicios gestionados por systemd en las plataformas.
  • Prometheus: se encarga de la recolección y almacenamiento temporal de las métricas obtenidas.
  • Grafana: permite al usuario visualizar todas las métricas recolectadas de forma centralizada mediante paneles interactivos.
Figura 1: Arquitectura de monitorización, observabilidad y acercamiento al usuario.

Gracias a esta arquitectura, la monitorización no se limita únicamente a los contenedores que alojan los modelos de IA, sino que cubre también el estado general del sistema y los servicios críticos que permiten su correcto funcionamiento. Esto proporciona una visión integral del comportamiento y estabilidad de cada plataforma, desde la infraestructura base hasta la ejecución de las cápsulas de IA. La arquitectura propuesta ha sido diseñada con un enfoque modular y escalable, lo cual permite la incorporación de nuevas fuentes de métricas, ampliando así la capacidad de análisis a medida que evolucionen las necesidades específicas del proyecto. Esta flexibilidad resulta especialmente relevante en entornos industriales, donde los requisitos pueden varias en función del caso de uso o de las plataformas hardware utilizadas. Además, la monitorización continua facilita la detección temprana de comportamientos anómalos, permitiendo aplicar medidas correctivas de manera ágil para garantizar un rendimiento óptimo del sistema.

Conclusión


En CAPSUL-IA, no sólo buscamos acercar la Inteligencia Artificial a la industria, sino garantizar que su funcionamiento sea estable, seguro y eficiente en entornos reales. Para ello, la monitorización y la observabilidad toman un papel fundamental, permitiendo mantener el control sobre el comportamiento de los sistemas y anticipar posibles incidencias. Gracias a la arquitectura diseñada, el proyecto CAPSUL-IA continúa consolidando una propuesta tecnológica orientada al acceso de la IA y a su integración fiable, eficiente y escalable dentro del tejido industrial.

Jorge Campello – Investigador I+D

Agradecimientos

Proyecto MIG-20232044, subvencionado por el CDTI – Centro de Desarrollo Tecnológico Industrial, apoyado por el Ministerio de Ciencia e Innovación, y aprobado en la convocatoria para el año 2023 del procedimiento de concesión de ayudas destinadas a “Misiones de Ciencia e Innovación” en el marco de la iniciativa TransMisiones 2023, en el ámbito del Programa Estatal para Catalizar la Innovación y el Liderazgo Empresarial del Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023.

 Proyecto PLEC2023-010240 financiado por MICIU/AEI/10.13039/501100011033:

Leave a Reply