📋
01 / 09
개요 & 정의
DR 아키텍처 개요, RTO/RPO 정의, Warm/Cold Standby 전략, 재난 상황 정의
ArchitectureRTO/RPOStrategy
Architecture
DR 상황 발생 전 — 전체 아키텍처
* 회사명, IP, 도메인 등 민감 정보는 일반화하여 표시했습니다
Overview
아키텍처 구성 요약
Primary Region — Seoul (ap-northeast-2)
컴퓨팅
- • EC2 인스턴스 (PRD, DB, CB, APP)
- • ECS + Fargate (컨테이너 서비스)
- • Proxy / Sterling 서버
네트워크
- • VPC (Public / Private Subnet)
- • NLB (L4 로드밸런서)
- • VPN Site-to-Site Connection
- • NAT Gateway
스토리지 & 데이터
- • EBS (스냅샷 기반 복제)
- • EFS + S3 (Cross-Region Replication)
- • ECR (컨테이너 이미지)
외부 연동
- • API Gateway (외부 파트너 연동)
- • GCP 연동 (External LB → Agent → DB)
- • Prod / Stage 환경 분리
Secondary Region — Oregon (us-west-2)
Primary Region과 동일한 네트워크 구조(사설 IP 구성 동일)를 유지하며, Warm/Cold Standby 전략에 따라 리소스를 사전 생성합니다. DR 발생 시 Global Accelerator를 통해 트래픽을 전환하고, standby EC2 서버를 기동하여 서비스를 복구합니다.
DR Flow
DR 전환 흐름
1
정상 운영
Primary Region(Seoul)에서 모든 트래픽 처리
2
DR 감지
모니터링 지표 기반 장애 감지, DR 상황 판단
3
트래픽 전환
Global Accelerator를 통해 Secondary Region(Oregon)으로 트래픽 전환
4
Secondary 활성화
Standby EC2 기동, EBS 연결, ECS+Fargate 순차 기동, VPN 연결
5
Health Check
서비스 상태 확인, 포트/채널 정상 작동 여부, 로그 저장
6
서비스 복구
Secondary Region에서 정상 서비스 운영
7
Failback
Primary Region 복구 후 트래픽 재전환, Secondary 비활성화
Comparison
Primary vs Secondary Region
| 구분 | Primary (Seoul) | Secondary (Oregon) |
|---|---|---|
| EC2 | Active (PRD, DB) | Standby (AMI 기반 사전 생성) |
| ECS + Fargate | Active | ECR 이미지 사전 복제, 기동 대기 |
| EBS | Active | 주 2회 스냅샷 기반 사전 생성 |
| EFS | Active | Region 간 교차 접근 불가 → S3 백업 |
| S3 | Active | Cross-Region Replication |
| VPN | Active | 사전 연결 필요 |
| NLB / ALB | Active | 사전 생성 |
| 사설 IP | 구성 완료 | Seoul과 동일 구성 |
| Global Accelerator | 리스너 등록 | 리스너 등록 (전환 대상) |