🖥
02 / 11
환경 구성
Label Studio + EasyOCR + LLM 환경 구성, Cloud/On-premise, 필요 자원
Label StudioEasyOCRDockerGPU
Cloud / On-premise
온프레미스에서 가능한지?
Label Studio + ML Backend(Tesseract) + LayoutLM 학습/추론 + 후처리 + 데이터 저장 → 전부 온프레미스에서 가능
단, AWS를 쓸 때 "공짜로 제공되던 것(관리형/자동화/확장성)"을 온프레미스에선 직접 운영(스토리지/스케줄러/모니터링/보안/백업)해야 함
AWS 구성요소 ↔ 온프레미스 대체
S3
온프레미스 대체 옵션
- •MinIO (S3 호환성 높음)
Lambda 전처리/후처리
온프레미스 대체 옵션
- •단순 systemd timer + Python 스크립트
- •이벤트 기반 필요 시: MinIO Event Notification → Webhook → 처리 서버 호출
- •Kafka / RabbitMQ 같은 메시지 큐
SageMaker 학습
온프레미스 대체 옵션
- •GPU 서버 (직접 운영)
클라우드 ↔ 온프레미스 전환이 가능한 이유
1
스토리지 추상화
- •S3 ↔ MinIO ↔ 로컬 디스크 교체 가능
- •경로만 바꾸면 동일 코드 사용
2
모델과 운영 로직 분리
- •모델은 학습/추론만 담당
- •자동화, 검증, 후처리는 별도 계층
3
Label Studio의 유연성
- •S3 / MinIO / Local Storage 지원
- •Cloud·On-Prem 동일 UI·워크플로우
Infrastructure
필요 자원
AWS 권장 최소 스펙
최소
EC2: t3a.large (2 vCPU, 8GB RAM)
- •정말 최소로 "돌아가게" 하는 라인
- •단, PDF/이미지 많거나 Label Studio가 무거운 프로젝트면 RAM이 빡빡할 수 있음
안정적 최소
EC2: t3a.xlarge / m6a.xlarge (4 vCPU, 16GB RAM)
- •Label Studio + 배치/추론을 같이 돌릴 때 체감 안정성이 확 올라감
- •"Label Studio 자체도 은근 자원 먹는다"는 체감과 잘 맞는 쪽
GPU 서버 (SageMaker)
ml.g4dn.xlarge
NVIDIA T4 GPU 1개, 4 vCPU, 16GB 메모리 — 시간당 $0.736
하루 사용 시간
20~30분
사용 일수
주 5일
한 달
약 20일
| 항목 | 비용 (USD) | 비용 (KRW) |
|---|---|---|
| 최소 (20분/일) | $4.92 | 약 7,100원 |
| 평균 (25분/일) | $6.16 | 약 8,900원 |
| 최대 (30분/일) | $7.36 | 약 10,700원 |
NVIDIA T4 GPU 사양
아키텍처Turing (2세대 Tensor 코어)
출시 시기2018년 9월
GPU 메모리16GB GDDR6
메모리 대역폭320 GB/s
CUDA 코어2,560개
Tensor 코어320개 (혼합 정밀도 연산 가속)
전력 소비70W (TDP)
폼팩터PCIe 저전력 (싱글 슬롯, 팬리스 가능)
인터페이스PCIe 3.0 x16
온프레미스 GPU(그래픽카드) 추천 — NVIDIA T4 대안
| GPU | 메모리 | TDP | 학습 성능 | 가격대 | 추천 대상 |
|---|---|---|---|---|---|
| RTX 4060 Ti | 16GB | 165W | 88 TFLOPS | 60-70만원 | 예산 제한 |
| RTX 4070 | 12GB | 200W | 116 TFLOPS | 90-100만원 | 균형잡힌 선택 |
| RTX 4080 | 16GB | 320W | 242 TFLOPS | 170-180만원 | 빠른 학습 필요 |
| RTX 3090 (중고) | 24GB | 350W | 142 TFLOPS | 80-100만원 | 가성비 좋음 |
| RTX 4090 | 24GB | 450W | 330 TFLOPS | 250-280만원 | 최고 성능 |
온프레미스 최소 스펙
A. GPU 1대 "올인원" (현실적 최소)
- •CPU: 8~16코어급
- •RAM: 32GB (최소 16GB도 가능은 한데, LS까지 같이 돌리면 32GB가 훨씬 편함)
- •GPU: 12GB VRAM 이상 1장 권장 (예: RTX 3060 12GB / RTX 4070 12GB)
- •스토리지: NVMe SSD 1TB 권장 (캐시/데이터/도커/로그)
LayoutLM는 "추론은 가볍고, 학습은 배치/시퀀스 길이"에 따라 VRAM이 영향을 많이 받음. 배치사이즈(2) 기준이면 12GB면 대체로 버틸 확률이 높음.
B. CPU 서버 1 + GPU 서버 1 (운영 안정형)
- •CPU 서버 (Label Studio): 4~8코어 / RAM 16GB
- •GPU 서버 (추론/학습): 위의 GPU 구성