Esforços da Datadog para reduzir custos
Ao analisarmos o uso do Datadog pela Zaxby, descobrimos que havia uma oportunidade significativa de reduzir custos sem comprometer a visibilidade ou a confiabilidade operacional. Nosso objetivo era simples: otimizar os gastos, mantendo a confiança no monitoramento e na observabilidade. Após analisar os padrões de uso e as áreas de alto custo, conseguimos reduzir os gastos com o Datadog em aproximadamente 50%.
Principais resultados:
- Redução do volume de logs indexados, preservando ao mesmo tempo os logs críticos para resolução de problemas e conformidade.
- Políticas de retenção de RUM otimizadas para manter a visibilidade do comportamento essencial do usuário.
- Reavaliamos o monitoramento sem servidor para reter informações valiosas e, ao mesmo tempo, eliminar invocações desnecessárias.
- Conseguimos uma redução geral de 50% nos gastos com o Datadog.
Registros indexados
A indexação logarítmica foi o item que mais contribuiu para o gasto total. Ao analisarmos os pipelines e índices, descobrimos que uma parcela significativa dos registros não agregava valor relevante. Ao refinar os registros indexados e aprimorar a marcação para facilitar a busca, conseguimos preservar os registros que realmente importavam, reduzindo o volume desnecessário.
As principais ações incluíram:
- Auditar os índices de log e os pipelines atuais para verificar o que estava sendo excluído (se é que algo estava sendo excluído).
- Analisando logs de alto volume por serviço para entender os principais contribuintes.
- Criação e aprimoramento de filtros de exclusão de logs para garantir que apenas os logs essenciais sejam indexados.
- Atualização de pipelines para melhoria na marcação e na capacidade de busca, vinculação de serviços e ambientes a logs específicos.
- Utilizando o Metric Explorer para acompanhar tendências e ajustar filtros e configurações de índice para equilibrar a observabilidade com a eficiência de custos.
Esse processo esclareceu quais conjuntos de dados eram realmente valiosos para operações e alertas.
Retenção de RUM
O monitoramento de usuários reais (RUM, na sigla em inglês) forneceu informações valiosas; percebemos que estávamos coletando e analisando todas as sessões. Após analisarmos as políticas de retenção em todos os aplicativos, ajustamos as configurações com base na frequência de uso e na criticidade para os negócios.
Medidas que tomamos:
- Analisamos todos os pedidos de uso de recursos (RUM) e seus respectivos períodos de retenção.
- Políticas de retenção ajustadas com base na frequência de uso e na criticidade das experiências monitoradas.
- Painéis e alertas validados para garantir que nenhuma informação importante fosse perdida durante a otimização.
Os painéis de controle e os alertas continuaram a funcionar conforme o esperado, enquanto o espaço de armazenamento ocupado foi significativamente reduzido. O resultado foi uma coleta de dados RUM mais enxuta e objetiva, que manteve total visibilidade do comportamento do usuário.
Auditoria de invocação sem servidor
Por fim, analisamos o monitoramento sem servidor. Algumas funções do AWS Lambda estavam gerando milhões de invocações semanalmente, e estávamos registrando cada chamada. Ao filtrar as invocações não críticas, mantivemos a integridade das principais métricas sem qualquer impacto no desempenho.
Esse ajuste proporcionou uma visão mais clara da atividade do Lambda e demonstrou como mudanças direcionadas podem gerar reduções de custos significativas sem comprometer a observabilidade.
Conclusão
Por meio dessa iniciativa de otimização de custos, a Arbory Digital reduziu com sucesso as despesas da Datadog para a Zaxby's em 50%, mantendo a visibilidade e a confiabilidade operacional. Ao aprimorar a indexação de logs, ajustar a retenção de RUM e auditar invocações sem servidor, estabelecemos um sistema sustentável que equilibra custo e funcionalidade.
Embora tenhamos alcançado progressos significativos, continuamos a monitorar e aprimorar os padrões de uso para identificar eficiências adicionais e garantir que a Zaxby's mantenha um modelo de observabilidade ideal.
Para obter mais informações, consulte nossas outras iniciativas de redução de custos no Destaque do Cliente da Zaxby – Arbory Digital.
Palestrantes de podcast
Gostou do que ouviu? Tem dúvidas sobre o que é certo para você? Adoraríamos conversar! Entre em contato conosco