Found Description
Resumen
Buscamos un/a Platform Monitoring Owner con experiencia en plataformas de monitorización basadas en Prometheus y Grafana , gestión de entornos con GPU , administración de plataformas Linux y contenedores Docker. La persona será responsable de la evolución de las plataformas de monitorización, alineando métricas técnicas con objetivos de negocio y liderando iniciativas de Capacity Planning , Infrastructure Lifecycle Management , Demand Forecasting y definición de la hoja de ruta de las plataformas.
Funciones
- Monitorizar y analizar la utilización de GPU en diferentes clústeres mediante dashboards de Prometheus y Grafana.
- Diseñar, mantener y evolucionar plataformas de monitorización y observabilidad.
- Desarrollar y mantener modelos de capacidad para prever necesidades futuras de infraestructura.
- Definir estrategias de escalado, renovación de hardware y optimización de costes. ...
Ready to Apply?
Submit your application for Arquitecto de infraestructuras IA at TECDATA ENGINEERING
Apply Now