Esfuerzos de reducción de costos de Datadog
Cuando revisamos el uso de Datadog de Zaxby, descubrimos que había una oportunidad significativa para reducir costos sin comprometer la visibilidad o la confiabilidad operativa. Nuestro objetivo era sencillo: optimizar el gasto manteniendo la confianza en el monitoreo y la observabilidad. Después de analizar los patrones de uso y las áreas de alto costo, redujimos con éxito el gasto de Datadog en aproximadamente un 50%.
Resultados clave:
- Reducción de los volúmenes de registro indexados al tiempo que se conservan los registros críticos para la resolución de problemas y el cumplimiento
- Políticas de retención de RUM optimizadas para mantener la visibilidad del comportamiento esencial del usuario
- Supervisión sin servidor reevaluada para retener información valiosa y eliminar invocaciones innecesarias
- Logró una reducción general del 50% en el gasto de Datadog
Registros indexados
La indexación de registros fue el mayor contribuyente al gasto general. A medida que revisamos las canalizaciones y los índices, descubrimos que una parte significativa de los registros no agregaba un valor significativo. Al refinar los registros indexados y mejorar el etiquetado para la capacidad de búsqueda, pudimos preservar los registros que realmente importaban y reducir el volumen innecesario.
Las acciones clave incluyeron:
- Auditoría de los índices de registro y las canalizaciones actuales para ver qué se estaba excluyendo (si es que se estaba excluyendo algo)
- Análisis de registros de gran volumen por servicio para comprender los principales contribuyentes
- Creación y refinamiento de filtros de exclusión de registros para garantizar que solo se indexen los registros esenciales
- Actualización de canalizaciones para mejorar el etiquetado y la capacidad de búsqueda, adjuntando servicios y entornos a registros específicos
- Uso del Explorador de métricas para realizar un seguimiento de las tendencias y ajustar los filtros y las configuraciones de índices para equilibrar la observabilidad con la rentabilidad
Este proceso aclaró qué conjuntos de datos eran realmente valiosos para las operaciones y las alertas.
Retención de RUM
El monitoreo de usuarios reales (RUM) proporcionó información valiosa, nos dimos cuenta de que estábamos recopilando y analizando cada sesión. Después de revisar las directivas de retención en todas las aplicaciones, ajustamos la configuración en función de la frecuencia de uso y la importancia para el negocio.
Pasos que tomamos:
- Revisó todas las solicitudes de RUM y sus períodos de retención
- Políticas de retención ajustadas en función de la frecuencia de uso y la criticidad de las experiencias supervisadas
- Paneles y alertas validados para garantizar que no se pierda información clave durante la optimización
Los paneles y las alertas continuaron funcionando como se esperaba, mientras que la huella de almacenamiento se redujo significativamente. El resultado fue una recopilación más ágil y útil de datos RUM que mantuvo una visibilidad completa del comportamiento del usuario.
Auditoría de invocación sin servidor
Finalmente, revisamos el monitoreo sin servidor. Algunas funciones de AWS Lambda generaban millones de invocaciones semanalmente y registrábamos cada llamada. Al filtrar las invocaciones no críticas, mantuvimos la integridad de las métricas clave sin ningún impacto en el rendimiento.
Este ajuste proporcionó una visión más clara de la actividad de Lambda y demostró cómo los cambios específicos pueden lograr reducciones de costos significativas sin comprometer la observabilidad.
Conclusión
A través de esta iniciativa de optimización de costos, Arbory Digital redujo con éxito los gastos de Datadog para Zaxby's en un 50%, todo mientras mantenía la visibilidad y la confiabilidad operativa. Al refinar la indexación de registros, ajustar la retención de RUM y auditar las invocaciones sin servidor, establecimos un sistema sostenible que equilibra el costo y la funcionalidad.
Si bien se han logrado avances significativos, continuamos monitoreando y refinando los patrones de uso para identificar eficiencias adicionales y garantizar que Zaxby's mantenga un modelo de observabilidad óptimo.
Para obtener más información, consulte nuestros otros esfuerzos de ahorro de costos en el Customer Spotlight de Zaxby: Arbory Digital.
Oradores de podcast
¿Te gusta lo que escuchaste? ¿Tiene preguntas sobre lo que es adecuado para usted? ¡Nos encantaría hablar! Contáctenos