Datadogのコスト削減の取り組み
Zaxby の Datadog の使用状況を調査したところ、可視性や運用の信頼性を損なうことなくコストを大幅に削減できる可能性があることがわかりました。私たちの目標は単純明快でした。監視と観測可能性に対する信頼を維持しながら、支出を最適化することでした。使用パターンと高コスト領域を分析した結果、Datadog の支出を約 50% 削減することに成功しました。
主な成果:
- トラブルシューティングとコンプライアンスのために重要なログを保持しながら、インデックス化されたログの量を削減
- 重要なユーザー行動の可視性を維持するために最適化された RUM 保持ポリシー
- 不要な呼び出しを排除しながら貴重な洞察を保持するためにサーバーレス監視を再評価しました
- Datadogの支出を全体で50%削減
インデックス付きログ
ログのインデックス作成が全体の支出に最も大きく貢献しました。パイプラインとインデックスを確認したところ、ログの大部分が意味のある価値を追加していないことがわかりました。どのログをインデックスするかを絞り込み、検索性を高めるためにタグ付けを改善することで、不要な量を削減しながら、本当に重要なログを保存することができました。
主なアクションは次のとおりです。
- 現在のログ インデックスとパイプラインを監査して、何が除外されているかを確認します (除外されているものがある場合)
- 大量のログをサービス別に分析し、主要な要因を理解する
- ログ除外フィルタを作成して調整し、必要なログのみがインデックスされるようにする
- パイプラインを更新してタグ付けと検索性を向上させ、特定のログにサービスと環境を添付する
- Metric Explorer を使用して傾向を追跡し、フィルターとインデックス構成を調整して、観測性とコスト効率のバランスをとる
このプロセスにより、どのデータセットが運用とアラートにとって本当に価値があるかが明確になりました。
RUM保持
リアル ユーザー モニタリング (RUM) によって貴重な洞察が得られ、すべてのセッションを収集して分析していることがわかりました。アプリケーション全体の保持ポリシーを確認した後、使用頻度とビジネス上の重要性に基づいて設定を調整しました。
私たちが取った手順:
- すべてのRUMアプリケーションとその保存期間を確認しました
- 使用頻度と監視対象エクスペリエンスの重要性に基づいて調整された保持ポリシー
- 最適化中に重要な洞察が失われないようにダッシュボードとアラートを検証しました
ダッシュボードとアラートは期待どおりに機能し続け、ストレージのフットプリントは大幅に削減されました。その結果、ユーザーの行動を完全に可視化しながら、より無駄のない、より目的に沿った RUM データの収集が可能になりました。
サーバーレス呼び出し監査
最後に、サーバーレス監視について確認しました。いくつかの AWS Lambda 関数が毎週何百万もの呼び出しを生成し、すべての呼び出しがログに記録されていました。重要でない呼び出しをフィルタリングすることで、パフォーマンスに影響を与えることなく、主要なメトリックの整合性を維持しました。
この調整により、Lambda アクティビティがより明確に把握できるようになり、対象を絞った変更によって、観測性を損なうことなく大幅なコスト削減を実現できることが実証されました。
結論
このコスト最適化の取り組みを通じて、Arbory Digital は可視性と運用の信頼性を維持しながら、Zaxby's の Datadog 経費を 50% 削減することに成功しました。ログのインデックス作成を改良し、RUM の保持を調整し、サーバーレス呼び出しを監査することで、コストと機能性のバランスが取れた持続可能なシステムを確立しました。
大きな進歩はありましたが、さらなる効率性を特定し、Zaxby が最適な観測可能性モデルを維持できるようにするために、使用パターンの監視と改良を続けています。
さらに詳しい情報については、 Zaxby の顧客スポットライト - Arbory Digitalにあるその他のコスト削減の取り組みをご覧ください。
ポッドキャストスピーカー
聞いてみてどうでしたか?自分に合ったものについてご質問がありますか?ぜひご相談ください!お問い合わせ