Anomalies
새벽 2시의 이상 비용도
자동으로 잡아냅니다.
AWS Cost Anomaly Detection과 자체 룰 엔진을 결합해 갑작스러운 egress 폭증, 특정 서비스 spike를 자동 감지. Slack · 이메일 · Webhook으로 즉시 알립니다.
‘평소’를 학습한 다음
‘튀는 순간’만 짚어줍니다
서비스 · 계정 · 리전 단위로 평소 패턴을 학습한 뒤, 통계적 임계값을 넘는 변동을 감지합니다. 평일/주말 · 월초/월말 같은 계절성도 자동으로 학습해 오탐을 줄입니다.
데모 요청하기이상은 곧 알림,
알림은 곧 라인아이템 근거
감지된 이상은 ‘어떤 서비스가 평소 대비 몇 % 늘었는지’ · ‘기여한 상위 리소스/태그’를 라인아이템 근거와 함께 Slack · 이메일 · Webhook으로 발송합니다. AWS Budgets · GCP Pub/Sub 이벤트도 같은 라우팅에 합류합니다.
알림 가이드Detection
두 가지 탐지 엔진의 결합
AWS의 머신러닝 기반 탐지와 OneCloud의 룰 기반 엔진을 함께 운영해 빠짐없이, 그러나 시끄럽지 않게.
ML
AWS Cost Anomaly Detection 연동
AWS의 머신러닝 기반 이상 탐지 결과(GetAnomalies)를 OneCloud 알림 · 리포트에 그대로 통합합니다.
Rules
자체 룰 엔진
임계값(>$X) · 증감률(>30% WoW) · 신규 서비스 등장 · egress 비중 같은 룰을 코드 없이 조립할 수 있습니다.
Routing
Slack · 이메일 · Webhook
이상별로 채널을 분기 — 인프라팀은 Slack #cost-alerts, 재무팀은 메일, 자동화는 Webhook으로.
Evidence
라인아이템 근거
각 알림에 ‘어떤 라인아이템이 이상에 가장 기여했는지’를 함께 첨부합니다. ‘왜 알렸는지’가 즉시 보입니다.
Sensitivity
조직별 감도 조절
팀·환경별로 알림 감도와 학습 윈도우를 분리해 운영. 프로덕션과 샌드박스가 같은 알림을 받지 않습니다.
Triage
확인 · 해소 · 메모
각 이상에 ‘확인’ · ‘해소’ · ‘무시’ 상태를 부여하고 메모를 남겨, 다음 결산 때 컨텍스트를 잃지 않습니다.