🖥

02 / 11

환경 구성

Label Studio + EasyOCR + LLM 환경 구성, Cloud/On-premise, 필요 자원

Label StudioEasyOCRDockerGPU

개요 환경 구성 OCR 파이프라인 모델 학습 모델 / 데이터 처리 LayoutLM 분석 성능 관리 배포 & 운영 PaddleOCR 도입 BIO 라벨 & 학습 개선 문제 해결

Cloud / On-premise

온프레미스에서 가능한지?

Label Studio + ML Backend(Tesseract) + LayoutLM 학습/추론 + 후처리 + 데이터 저장 → 전부 온프레미스에서 가능

단, AWS를 쓸 때 "공짜로 제공되던 것(관리형/자동화/확장성)"을 온프레미스에선 직접 운영(스토리지/스케줄러/모니터링/보안/백업)해야 함

AWS 구성요소 ↔ 온프레미스 대체

온프레미스 대체 옵션

•MinIO (S3 호환성 높음)

Lambda 전처리/후처리

온프레미스 대체 옵션

•단순 systemd timer + Python 스크립트
•이벤트 기반 필요 시: MinIO Event Notification → Webhook → 처리 서버 호출
•Kafka / RabbitMQ 같은 메시지 큐

SageMaker 학습

온프레미스 대체 옵션

•GPU 서버 (직접 운영)

클라우드 ↔ 온프레미스 전환이 가능한 이유

스토리지 추상화

•S3 ↔ MinIO ↔ 로컬 디스크 교체 가능
•경로만 바꾸면 동일 코드 사용

모델과 운영 로직 분리

•모델은 학습/추론만 담당
•자동화, 검증, 후처리는 별도 계층

Label Studio의 유연성

•S3 / MinIO / Local Storage 지원
•Cloud·On-Prem 동일 UI·워크플로우

Infrastructure

필요 자원

AWS 권장 최소 스펙

최소

EC2: t3a.large (2 vCPU, 8GB RAM)

•정말 최소로 "돌아가게" 하는 라인
•단, PDF/이미지 많거나 Label Studio가 무거운 프로젝트면 RAM이 빡빡할 수 있음

안정적 최소

EC2: t3a.xlarge / m6a.xlarge (4 vCPU, 16GB RAM)

•Label Studio + 배치/추론을 같이 돌릴 때 체감 안정성이 확 올라감
•"Label Studio 자체도 은근 자원 먹는다"는 체감과 잘 맞는 쪽

GPU 서버 (SageMaker)

ml.g4dn.xlarge

NVIDIA T4 GPU 1개, 4 vCPU, 16GB 메모리 — 시간당 $0.736

하루 사용 시간

20~30분

사용 일수

주 5일

한 달

약 20일

항목	비용 (USD)	비용 (KRW)
최소 (20분/일)	$4.92	약 7,100원
평균 (25분/일)	$6.16	약 8,900원
최대 (30분/일)	$7.36	약 10,700원

NVIDIA T4 GPU 사양

아키텍처Turing (2세대 Tensor 코어)

출시 시기2018년 9월

GPU 메모리16GB GDDR6

메모리 대역폭320 GB/s

CUDA 코어2,560개

Tensor 코어320개 (혼합 정밀도 연산 가속)

전력 소비70W (TDP)

폼팩터PCIe 저전력 (싱글 슬롯, 팬리스 가능)

인터페이스PCIe 3.0 x16

온프레미스 GPU(그래픽카드) 추천 — NVIDIA T4 대안

GPU	메모리	TDP	학습 성능	가격대	추천 대상
RTX 4060 Ti	16GB	165W	88 TFLOPS	60-70만원	예산 제한
RTX 4070	12GB	200W	116 TFLOPS	90-100만원	균형잡힌 선택
RTX 4080	16GB	320W	242 TFLOPS	170-180만원	빠른 학습 필요
RTX 3090 (중고)	24GB	350W	142 TFLOPS	80-100만원	가성비 좋음
RTX 4090	24GB	450W	330 TFLOPS	250-280만원	최고 성능

온프레미스 최소 스펙

A. GPU 1대 "올인원" (현실적 최소)

•CPU: 8~16코어급
•RAM: 32GB (최소 16GB도 가능은 한데, LS까지 같이 돌리면 32GB가 훨씬 편함)
•GPU: 12GB VRAM 이상 1장 권장 (예: RTX 3060 12GB / RTX 4070 12GB)
•스토리지: NVMe SSD 1TB 권장 (캐시/데이터/도커/로그)

LayoutLM는 "추론은 가볍고, 학습은 배치/시퀀스 길이"에 따라 VRAM이 영향을 많이 받음. 배치사이즈(2) 기준이면 12GB면 대체로 버틸 확률이 높음.

B. CPU 서버 1 + GPU 서버 1 (운영 안정형)

•CPU 서버 (Label Studio): 4~8코어 / RAM 16GB
•GPU 서버 (추론/학습): 위의 GPU 구성

← 개요 OCR 파이프라인 →