MinIO 도입기— HA 이해 및 DR 전략 구성
4
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

MinIO 도입 및 고가용성(HA) 이해

이 게시물은 네이버 G플레이스AI개발 팀이 머신러닝 데이터 아카이빙을 위해 MinIO를 도입하고, 스토리지의 HA와 DR 전략을 구성한 과정을 설명합니다.

MinIO 도입 배경 및 장애 대응

  • 기존 Cephfs의 과도한 세션 사용으로 인한 장애 문제 해결
  • MinIO의 분산 S3 오브젝트 스토리지 구성과 Erasure Coding 기반 데이터 복구 기술 적용
  • 노드, 드라이브, IDC 레벨 장애를 정의하고 이에 따른 장애 대응 매뉴얼 작성

DR 전략과 백업 시스템 구축

  • 서비스 영향성에 따른 DR 전략 분류 및 우선순위 지정
  • 원본 데이터 백업 방식을 채택하고, HDFS를 이용한 IDC 이중화 구성
  • Airflow 기반 백업/복구 자동화 및 성능 검증 수행

고가용성 및 확장성 테스트

  • 4대 서버 분산 MinIO 구성에서 서버 및 드라이브 장애 시 데이터 접근 및 정합성 테스트
  • Scale Up/Out 과정에서 데이터 읽기/쓰기 순단 여부 점검 및 클라이언트 방어 로직 적용

결론

MinIO의 강력한 Failover 기능과 체계적인 백업/복구 전략을 통해 데이터 유실 최소화 및 IDC 수준 장애 대응이 가능함을 검증하였으며, 향후 RTO/RPO 개선과 다양한 DR 플랜 도입 필요성을 제시합니다.

연관 게시글