Efforts de réduction des coûts de Datadog
Lorsque nous avons examiné l’utilisation de Datadog par Zaxby, nous avons constaté qu’il existait une opportunité importante de réduire les coûts sans compromettre la visibilité ou la fiabilité opérationnelle. Notre objectif était simple : optimiser les dépenses tout en conservant la confiance dans le suivi et l’observabilité. Après avoir analysé les modèles d’utilisation et les zones à coût élevé, nous avons réussi à réduire les dépenses Datadog d’environ 50 %.
Principaux résultats :
- Réduction des volumes de journaux indexés tout en préservant les journaux critiques pour le dépannage et la conformité
- Politiques de rétention RUM optimisées pour maintenir la visibilité sur le comportement essentiel des utilisateurs
- Réévaluation de la surveillance sans serveur pour conserver des informations précieuses tout en éliminant les appels inutiles
- Réduction globale de 50 % des dépenses Datadog
Journaux indexés
L’indexation des journaux a été le principal contributeur aux dépenses globales. En examinant les pipelines et les index, nous avons découvert qu’une partie importante des journaux n’ajoutait pas de valeur significative. En affinant les journaux indexés et en améliorant le balisage pour faciliter la recherche, nous avons pu préserver les journaux qui comptaient vraiment tout en réduisant le volume inutile.
Les principales mesures ont été prises :
- Audit des index de journaux et des pipelines actuels pour voir ce qui a été exclu (le cas échéant)
- Analyse des journaux à volume élevé par service pour comprendre les principaux contributeurs
- Création et amélioration de filtres d’exclusion de journaux pour s’assurer que seuls les journaux essentiels ont été indexés
- Mise à jour des pipelines pour améliorer le balisage et la recherche, en attachant des services et des environnements à des journaux spécifiques
- Utilisation de Metric Explorer pour suivre les tendances et ajuster les filtres et les configurations d’indices afin d’équilibrer l’observabilité et la rentabilité
Ce processus a permis de déterminer quels ensembles de données étaient réellement précieux pour les opérations et les alertes.
Rétention du RUM
Le Real User Monitoring (RUM) nous a fourni des informations précieuses, nous nous sommes rendu compte que nous recueillions et analysions chaque session. Après avoir examiné les politiques de rétention des applications, nous avons ajusté les paramètres en fonction de la fréquence d’utilisation et de la criticité de l’entreprise.
Mesures que nous avons prises :
- Examen de toutes les applications RUM et de leurs périodes de conservation
- Stratégies de rétention ajustées en fonction de la fréquence d’utilisation et de la criticité des expériences surveillées
- Tableaux de bord et alertes validés pour s’assurer qu’aucune information clé n’a été perdue lors de l’optimisation
Les tableaux de bord et les alertes ont continué à fonctionner comme prévu, tandis que l’encombrement du stockage a été considérablement réduit. Le résultat a été une collecte plus légère et plus ciblée de données RUM qui a maintenu une visibilité totale sur le comportement des utilisateurs.
Audit d’invocation sans serveur
Enfin, nous avons examiné la surveillance sans serveur. Quelques fonctions AWS Lambda généraient des millions d’appels par semaine, et nous enregistrions chaque appel. En filtrant les appels non critiques, nous avons maintenu l’intégrité des indicateurs clés sans aucun impact sur les performances.
Cet ajustement a fourni une vue plus claire de l’activité Lambda et a démontré comment des changements ciblés peuvent permettre d’obtenir des réductions de coûts significatives sans compromettre l’observabilité.
Conclusion
Grâce à cette initiative d’optimisation des coûts, Arbory Digital a réussi à réduire de 50 % les dépenses de Datadog pour Zaxby’s, tout en maintenant la visibilité et la fiabilité opérationnelle. En affinant l’indexation des logs, en ajustant la rétention RUM et en auditant les appels sans serveur, nous avons mis en place un système durable qui équilibre les coûts et les fonctionnalités.
Bien que des progrès significatifs aient été réalisés, nous continuons à surveiller et à affiner les modèles d’utilisation afin d’identifier des gains d’efficacité supplémentaires et de nous assurer que Zaxby’s maintient un modèle d’observabilité optimal.
Pour plus d’informations, consultez nos autres efforts de réduction des coûts dans le Pleins feux sur les clients de Zaxby – Arbory Digital.
Intervenants du podcast
Vous aimez ce que vous avez entendu ? Vous avez des questions sur ce qui vous convient le mieux ? Nous serions ravis de discuter ! Contactez-nous