← AI Document Processing
🖥

02 / 11

환경 구성

Label Studio + EasyOCR + LLM 환경 구성, Cloud/On-premise, 필요 자원

Label StudioEasyOCRDockerGPU
개요환경 구성OCR 파이프라인모델 학습모델 / 데이터 처리LayoutLM 분석성능 관리배포 & 운영PaddleOCR 도입BIO 라벨 & 학습 개선문제 해결

Cloud / On-premise

온프레미스에서 가능한지?

Label Studio + ML Backend(Tesseract) + LayoutLM 학습/추론 + 후처리 + 데이터 저장 → 전부 온프레미스에서 가능

단, AWS를 쓸 때 "공짜로 제공되던 것(관리형/자동화/확장성)"을 온프레미스에선 직접 운영(스토리지/스케줄러/모니터링/보안/백업)해야 함

AWS 구성요소 ↔ 온프레미스 대체

S3

온프레미스 대체 옵션

  • MinIO (S3 호환성 높음)

Lambda 전처리/후처리

온프레미스 대체 옵션

  • 단순 systemd timer + Python 스크립트
  • 이벤트 기반 필요 시: MinIO Event Notification → Webhook → 처리 서버 호출
  • Kafka / RabbitMQ 같은 메시지 큐

SageMaker 학습

온프레미스 대체 옵션

  • GPU 서버 (직접 운영)

클라우드 ↔ 온프레미스 전환이 가능한 이유

1

스토리지 추상화

  • S3 ↔ MinIO ↔ 로컬 디스크 교체 가능
  • 경로만 바꾸면 동일 코드 사용
2

모델과 운영 로직 분리

  • 모델은 학습/추론만 담당
  • 자동화, 검증, 후처리는 별도 계층
3

Label Studio의 유연성

  • S3 / MinIO / Local Storage 지원
  • Cloud·On-Prem 동일 UI·워크플로우

Infrastructure

필요 자원

AWS 권장 최소 스펙

최소

EC2: t3a.large (2 vCPU, 8GB RAM)

  • 정말 최소로 "돌아가게" 하는 라인
  • 단, PDF/이미지 많거나 Label Studio가 무거운 프로젝트면 RAM이 빡빡할 수 있음
안정적 최소

EC2: t3a.xlarge / m6a.xlarge (4 vCPU, 16GB RAM)

  • Label Studio + 배치/추론을 같이 돌릴 때 체감 안정성이 확 올라감
  • "Label Studio 자체도 은근 자원 먹는다"는 체감과 잘 맞는 쪽

GPU 서버 (SageMaker)

ml.g4dn.xlarge

NVIDIA T4 GPU 1개, 4 vCPU, 16GB 메모리 — 시간당 $0.736

하루 사용 시간

20~30분

사용 일수

주 5일

한 달

약 20일

항목비용 (USD)비용 (KRW)
최소 (20분/일)$4.92약 7,100원
평균 (25분/일)$6.16약 8,900원
최대 (30분/일)$7.36약 10,700원

NVIDIA T4 GPU 사양

아키텍처Turing (2세대 Tensor 코어)
출시 시기2018년 9월
GPU 메모리16GB GDDR6
메모리 대역폭320 GB/s
CUDA 코어2,560개
Tensor 코어320개 (혼합 정밀도 연산 가속)
전력 소비70W (TDP)
폼팩터PCIe 저전력 (싱글 슬롯, 팬리스 가능)
인터페이스PCIe 3.0 x16

온프레미스 GPU(그래픽카드) 추천 — NVIDIA T4 대안

GPU메모리TDP학습 성능가격대추천 대상
RTX 4060 Ti16GB165W88 TFLOPS60-70만원예산 제한
RTX 407012GB200W116 TFLOPS90-100만원균형잡힌 선택
RTX 408016GB320W242 TFLOPS170-180만원빠른 학습 필요
RTX 3090 (중고)24GB350W142 TFLOPS80-100만원가성비 좋음
RTX 409024GB450W330 TFLOPS250-280만원최고 성능

온프레미스 최소 스펙

A. GPU 1대 "올인원" (현실적 최소)

  • CPU: 8~16코어급
  • RAM: 32GB (최소 16GB도 가능은 한데, LS까지 같이 돌리면 32GB가 훨씬 편함)
  • GPU: 12GB VRAM 이상 1장 권장 (예: RTX 3060 12GB / RTX 4070 12GB)
  • 스토리지: NVMe SSD 1TB 권장 (캐시/데이터/도커/로그)

LayoutLM는 "추론은 가볍고, 학습은 배치/시퀀스 길이"에 따라 VRAM이 영향을 많이 받음. 배치사이즈(2) 기준이면 12GB면 대체로 버틸 확률이 높음.

B. CPU 서버 1 + GPU 서버 1 (운영 안정형)

  • CPU 서버 (Label Studio): 4~8코어 / RAM 16GB
  • GPU 서버 (추론/학습): 위의 GPU 구성
개요OCR 파이프라인