Redução de custos do Datadog

Redução de custos do Datadog

October 16, 2025
By Chase Hollander
  • observability
  • datadog
  • savings
  • tools
  • productivity
  • devops

Esforços da Datadog para reduzir custos

Ao analisarmos o uso do Datadog pela Zaxby, descobrimos que havia uma oportunidade significativa de reduzir custos sem comprometer a visibilidade ou a confiabilidade operacional. Nosso objetivo era simples: otimizar os gastos, mantendo a confiança no monitoramento e na observabilidade. Após analisar os padrões de uso e as áreas de alto custo, conseguimos reduzir os gastos com o Datadog em aproximadamente 50%.

Principais resultados:

  • Redução do volume de logs indexados, preservando ao mesmo tempo os logs críticos para resolução de problemas e conformidade.
  • Políticas de retenção de RUM otimizadas para manter a visibilidade do comportamento essencial do usuário.
  • Reavaliamos o monitoramento sem servidor para reter informações valiosas e, ao mesmo tempo, eliminar invocações desnecessárias.
  • Conseguimos uma redução geral de 50% nos gastos com o Datadog.

Registros indexados

A indexação logarítmica foi o item que mais contribuiu para o gasto total. Ao analisarmos os pipelines e índices, descobrimos que uma parcela significativa dos registros não agregava valor relevante. Ao refinar os registros indexados e aprimorar a marcação para facilitar a busca, conseguimos preservar os registros que realmente importavam, reduzindo o volume desnecessário.

As principais ações incluíram:

  • Auditar os índices de log e os pipelines atuais para verificar o que estava sendo excluído (se é que algo estava sendo excluído).
  • Analisando logs de alto volume por serviço para entender os principais contribuintes.
  • Criação e aprimoramento de filtros de exclusão de logs para garantir que apenas os logs essenciais sejam indexados.
  • Atualização de pipelines para melhoria na marcação e na capacidade de busca, vinculação de serviços e ambientes a logs específicos.
  • Utilizando o Metric Explorer para acompanhar tendências e ajustar filtros e configurações de índice para equilibrar a observabilidade com a eficiência de custos.

Esse processo esclareceu quais conjuntos de dados eram realmente valiosos para operações e alertas.

Retenção de RUM

O monitoramento de usuários reais (RUM, na sigla em inglês) forneceu informações valiosas; percebemos que estávamos coletando e analisando todas as sessões. Após analisarmos as políticas de retenção em todos os aplicativos, ajustamos as configurações com base na frequência de uso e na criticidade para os negócios.

Medidas que tomamos:

  • Analisamos todos os pedidos de uso de recursos (RUM) e seus respectivos períodos de retenção.
  • Políticas de retenção ajustadas com base na frequência de uso e na criticidade das experiências monitoradas.
  • Painéis e alertas validados para garantir que nenhuma informação importante fosse perdida durante a otimização.

Os painéis de controle e os alertas continuaram a funcionar conforme o esperado, enquanto o espaço de armazenamento ocupado foi significativamente reduzido. O resultado foi uma coleta de dados RUM mais enxuta e objetiva, que manteve total visibilidade do comportamento do usuário.

Auditoria de invocação sem servidor

Por fim, analisamos o monitoramento sem servidor. Algumas funções do AWS Lambda estavam gerando milhões de invocações semanalmente, e estávamos registrando cada chamada. Ao filtrar as invocações não críticas, mantivemos a integridade das principais métricas sem qualquer impacto no desempenho.

Esse ajuste proporcionou uma visão mais clara da atividade do Lambda e demonstrou como mudanças direcionadas podem gerar reduções de custos significativas sem comprometer a observabilidade.

Conclusão

Por meio dessa iniciativa de otimização de custos, a Arbory Digital reduziu com sucesso as despesas da Datadog para a Zaxby's em 50%, mantendo a visibilidade e a confiabilidade operacional. Ao aprimorar a indexação de logs, ajustar a retenção de RUM e auditar invocações sem servidor, estabelecemos um sistema sustentável que equilibra custo e funcionalidade.

Embora tenhamos alcançado progressos significativos, continuamos a monitorar e aprimorar os padrões de uso para identificar eficiências adicionais e garantir que a Zaxby's mantenha um modelo de observabilidade ideal.

Para obter mais informações, consulte nossas outras iniciativas de redução de custos no Destaque do Cliente da Zaxby – Arbory Digital.

Palestrantes de podcast

Photo of Chase Hollander

Chase Hollander
Desenvolvedor AEM na Arbory Digital

Profissional certificado em metodologias ágeis, desenvolvedor e consultor com experiência em AEM.

Entre em contato com Chase no LinkedIn.

Gostou do que ouviu? Tem dúvidas sobre o que é certo para você? Adoraríamos conversar! Entre em contato conosco

Episódios de podcast