02 / 07
모니터링 & 트리거
HTTP 모니터링, 파일 시스템 감시, 배치/API 러너, 장애 감지 조건 및 알림 트리거 구조
HTTP MonitorFolderMonitorTrigger
HTTP Monitor
HTTP 모니터링
대상 서버의 HTTP 응답 코드와 응답 시간을 주기적으로 점검하여 장애를 감지한다.
트리거 조건
응답 코드 이상
HTTP 응답 코드가 2xx 범위가 아닌 경우
응답 시간 초과
응답 시간이 3초(3000ms) 이상인 경우
판정 로직
if (responseCode < 200 || responseCode >= 300 || responseTime > 3000) {
// 문제 발생 → AlertHub 호출
alertHub.notify(service, alertConfig);
}HTTP Monitor Flow
Quartz Cron→HTTP Request→응답 코드/시간 체크→조건 불만족→AlertHub
Folder Monitor
파일 시스템 모니터링
특정 디렉토리의 파일 상태를 감시하여, 파일이 설정된 시간 이상 체류(적체)하면 장애로 간주한다.
트리거 조건
파일의 마지막 수정 시간 + 허용 시간(duration)을 초과한 경우
판정 로직
if (now.isAfter(lastModified + duration)) {
// 파일 적체 감지 → 장애로 간주
alertHub.notify(service, alertConfig);
}Trigger Architecture
알림 트리거 구조
모니터링 소스
HTTP Monitor
응답코드 != 2xx
HTTP Monitor
응답시간 > 3s
Folder Monitor
파일 적체 감지
Batch Runner
배치 실패 감지
YAML 조건 평가
total == 0fail > 100pending > 1000
AlertHub 병렬 발송
전화
SMS
Slack
Audit Log
CloudTrail + Athena 감사 로그 분석
실시간 모니터링 외에, 장애 원인 추적과 보안 감사를 위해 CloudTrail + S3 + Athena 기반의 장기 감사 로그 분석 환경을 구축했다. 관리 이벤트 감사, S3 파일 접근 추적, SES 이메일 발송 이력, VPC Flow Logs 트래픽 분석까지 하나의 Athena 환경에서 통합 관리한다.
AWS API 호출→CloudTrail→S3 (365일)→Athena (SQL)
감사 로그 분석 상세 보기 →