Anomalies
深夜 2 時の異常コストも
自動で検知。
AWS Cost Anomaly Detection と独自ルールエンジンを組み合わせ、突発的な egress 急増や特定サービスのスパイクを自動検知。Slack · メール · Webhook に即時通知します。
「平常」を学習してから、
「跳ねた瞬間」だけを指摘
サービス・アカウント・リージョン単位で平常パターンを学習し、統計的閾値を超える変動を検知します。平日/週末・月初/月末といった季節性も自動学習し、誤検知を抑えます。
デモをリクエスト異常はすなわち通知、
通知はラインアイテムの根拠つき
検知した異常は「どのサービスが平常比で何 % 増えたか」・「寄与した上位リソース/タグ」をラインアイテムの根拠とともに Slack · メール · Webhook へ配信します。AWS Budgets · GCP Pub/Sub のイベントも同じルーティングに参加します。
通知ガイドDetection
2 つの検知エンジンの併用
AWS の ML ベース検知と OneCloud のルールエンジンを併用。漏れなく、しかし騒がしくなく。
ML
AWS Cost Anomaly Detection 連携
AWS の ML ベース異常検知 (GetAnomalies) を OneCloud の通知・レポートにそのまま統合します。
Rules
独自ルールエンジン
閾値 (>$X)・変動率 (>30% WoW)・新規サービス出現・egress 割合のようなルールをコードなしで組めます。
Routing
Slack · メール · Webhook
異常ごとにチャネルを分岐 — インフラは Slack #cost-alerts、財務はメール、自動化は Webhook。
Evidence
ラインアイテムの根拠
各通知に「どのラインアイテムが最も寄与したか」を添付。「なぜ通知が来たか」が即座に分かります。
Sensitivity
組織別の感度調整
チーム・環境別に感度や学習ウィンドウを分けて運用。本番とサンドボックスが同じ通知を受け取らないように。
Triage
確認・解消・メモ
各異常に「確認」「解消」「無視」のステータスとメモを付与し、次の決算でコンテキストを失いません。