← Disaster Recovery
🛠️

09 / 09

서비스 설정 & 운영

Service 변경 상세, DB 설정, Kafka 처리, Sterling 자동화, ELB/ALB 구성

ELBDBKafkaAutomation
개요 & 정의인프라 & IaC리소스 사전 생성네트워크 & 트래픽장애 전환 (Failover)복구 (Failback)모니터링 & 지표혼란 테스트 & DR 훈련서비스 설정 & 운영

DR 아키텍처 설계 과정에서 논의된 주요 의사결정 사항들을 정리합니다. 각 토픽별로 검토된 방법과 서비스, 비용, 속도 관점에서의 분석을 포함합니다.

💾

DISCUSSION 01

EBS 리전 간 복제 대상

방법 1 — DB Disk + 운영 SW Disk 모두 복제

운영 SW 볼륨과 DB 볼륨을 모두 교차 리전 복제

  • 운영 SW 볼륨 (볼륨 크기: 100 GB, 스냅샷 크기: 99 GB)
  • DB 볼륨 1 (볼륨 크기: 900 GB, 스냅샷 크기: 880 GB)
  • DB 볼륨 2 (볼륨 크기: 200 GB, 스냅샷 크기: 188 GB)

방법 2 — DB Disk만 복제

DB 볼륨만 교차 리전 복제 (운영 SW는 AMI 기반 복구)

  • DB 볼륨 1 (볼륨 크기: 900 GB, 스냅샷 크기: 880 GB)
  • DB 볼륨 2 (볼륨 크기: 200 GB, 스냅샷 크기: 188 GB)

관점별 분석

⚙️

서비스 / 기능

방법 1은 운영 SW까지 최신 상태로 복구 가능하여 RTO 단축에 유리. 방법 2는 운영 SW를 AMI 기반으로 복구해야 하므로 추가 설정 작업 필요

💰

비용

방법 1은 총 ~1,167 GB 스냅샷 복제 비용 발생. 방법 2는 ~1,068 GB로 약 8.5% 절감

속도

방법 1은 전체 볼륨 복제로 시간 소요 증가. 방법 2는 복제 대상이 줄어 복제 속도 향상

🔄

DISCUSSION 02

EBS 리전 간 데이터 복제 방법

방법 1 — EBS 교차 리전 복제 (DLM)

AWS DLM(Data Lifecycle Manager)을 통한 EBS 스냅샷 교차 리전 복제

방법 2 — DB 서버 간 Replication 도입

DB 레벨에서 리전 간 Replication 구성

  • MariaDB — Replication Server 구성 (기존 방식과 동일)
  • DB2 — Replication 방법 검토 필요
  • EC2 인스턴스가 계속 실행 상태 유지 필요
  • EBS 볼륨도 상시 연결 상태

관점별 분석

⚙️

서비스 / 기능

방법 1은 AWS 관리형 서비스로 운영 부담 최소화. 방법 2는 DB 레벨 복제로 RPO를 더 줄일 수 있으나 DB2 Replication 구성 검토 필요

💰

비용

방법 1은 스냅샷 저장 + 전송 비용만 발생. 방법 2는 Secondary Region EC2 인스턴스 + EBS 상시 운영 비용 발생

속도

방법 1은 스냅샷 주기에 따른 RPO 제한 존재. 방법 2는 실시간에 가까운 복제 가능하나 네트워크 지연 고려 필요

📦

DISCUSSION 03

S3 리전 간 데이터 복제 방법

방법 1 — S3 CRR (Cross-Region Replication) 적용

AWS S3 기본 제공 교차 리전 복제 기능 활용

방법 2 — HUB 설정 변경 (Dual Write)

HUB가 바라보는 S3 Bucket을 2개로 지정하여 양쪽에 동시 업로드

  • HUB 구현 변경 필요 → 연구소 논의 필요
  • 아직 미정인 부분이며 추가 개발 공수 발생

관점별 분석

⚙️

서비스 / 기능

방법 1은 AWS 네이티브 기능으로 안정적이고 설정이 간단. 방법 2는 HUB 소스 코드 변경이 필요하며 연구소 협의 필수

💰

비용

방법 1은 S3 CRR 전송 비용 + 복제 대상 버킷 저장 비용. 방법 2는 추가 개발 인건비 + 동일한 저장 비용

속도

방법 1은 비동기 복제로 약간의 지연 존재 (RTC 활성화 시 15분 이내 보장). 방법 2는 동기 업로드로 즉시 반영되나 업로드 시간 증가

📁

DISCUSSION 04

EFS 관련 — ECS EFS 생성 여부

ECS EFS 도입

Secondary Region에도 ECS용 EFS를 생성하여 동일 구조 유지

  • 비용이 무시할 만한 수준으로 저렴
  • 현재 ECS들에 EFS mount된 상태
  • 동일 아키텍처 유지로 운영 복잡도 감소

관점별 분석

⚙️

서비스 / 기능

현재 Primary Region ECS에 EFS가 mount된 상태이므로, Secondary Region에도 동일하게 구성하는 것이 운영 일관성 확보에 유리

💰

비용

EFS 비용은 무시할 만한 수준으로 저렴하므로 도입 권장

결론

비용 대비 효과가 높아 ECS EFS 도입 제안

혼란 테스트 & DR 훈련