AWS DMS의 data resync 기능을 이용한 데이터 일관성 구현하기
12
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

AWS DMS Data Resync로 데이터 일관성 구현

이 게시물은 AWS Database Migration Service(DMS)의 데이터 재동기화(Data Resync) 기능으로 마이그레이션 중 발생하는 데이터 불일치를 자동으로 감지·해결하는 방법을 설명합니다.

기능 개요와 지원 범위

  • DMS 3.6.1에 도입되었으며, Validation으로 식별된 불일치에 대해 소스의 현재 값을 조회해 타겟에 적용(동기화)합니다.
  • 기존에는 테이블 Reload, CDC 재시작, 타겟 수동 수정 등 수동 개입이 필요했으나 이를 줄입니다.
  • 소스 Oracle/SQL Server → 타겟 PostgreSQL 또는 Aurora PostgreSQL 호환에서 지원되며, 마이그레이션 가능한 모든 리전에서 사용 가능합니다.

설정 방법과 동작 방식

  • Task 생성/수정 시 Data Resync를 활성화하고, CDC 포함 Task는 Cron 표현식으로 재동기화 스케줄과 최대 실행 시간(MaxResyncTime)을 설정합니다.
  • Full-load only Task는 모든 테이블 Validation 완료 직후 자동으로 Resync가 실행됩니다.
  • CDC 포함 Task는 Resync 시점에 CDC 및 Validation을 일시 중지했다가 Resync 후 재개하며, 워크로드가 낮은 시간대에 짧게 예약하는 것을 권장합니다.

불일치 추적 및 로그 확인

타겟(PostgreSQL)에는 awsdms_validation_failures_v2 테이블이 생성되어 Primary Key 기반으로 불일치와 Resync 결과(예: UPSERT, SUCCESS, RESYNC_TIME)를 추적합니다.
또한 CloudWatch/Task 로그에서 Resync 트리거, Validation/CDC 중지 및 재개, 테이블 Resync 수행 단계 메시지를 통해 진행 상황을 확인할 수 있습니다.

사용 사례

  • 타겟에서 실수로 레코드를 삭제한 경우, 재검증(Re-validation) 후 MISSING_TARGET 불일치를 식별하고 Resync가 UPSERT로 복구한 예를 제시합니다.
  • 테이블 오류로 CDC 적용이 중단된 상황에서, 오류 발생 시점(가장 이른 타임스탬프)을 기준으로 CDC-only Task를 구성하고 Resync로 충돌/불일치를 해결한 예를 설명합니다.

연관 게시글