Today
Total
KoreanEnglishFrenchGermanJapaneseSpanishChinese (Simplified)
관리 메뉴

DB & AWS Knowledge

Aurora Cluster 의 Global Database Switchover 및 Failover, Remove Region (독립 승격) 의 차이와 DR 설계 시, 이에 대한 의의 본문

AWS 및 클라우드 지식/AWS RDS, Aurora 및 관련 지식

Aurora Cluster 의 Global Database Switchover 및 Failover, Remove Region (독립 승격) 의 차이와 DR 설계 시, 이에 대한 의의

`O` 2024. 9. 3. 00:57
728x90
반응형

이 페이지에서는 Aurora Cluster 에서 두 Region 간 Cluster 동기화에 사용되는 Global Database 에서 제공하는 Switchover (전환) 와 Failover (장애 조치) , promotion 간의 차이 및 이에 따른 DR (Disaster Recovery) 설계 시 어떤 차이가 있는지를 다룬다.
 
또한 이 페이지는 아래의 AWS Document 및 이전 게시글을 참조한다.
 
[1] https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/aurora-global-database.html
 
[2] https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/aurora-global-database-disaster-recovery.html

 

[3] https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/AuroraUserGuide/aurora-global-database-managing.html

 
[4] 2023.05.15 - [AWS 및 클라우드 지식/AWS RDS, Aurora 및 관련 지식] - Aurora Cross Region Replica 와 Global database 의 특징

 

Aurora Cluster 의 Global Database 기능과 의의

 
Global Database 는 두 Region 간에 Aurora Cluster 데이터를 동기화 시키면서 지연을 최소화 하도록 설계 된 기능이다.
일반적으로 온프레미스에서 다른 국가간 replication 또는 데이터 동기화를 시켜두는 목적 중 하나가 바로 DR 을 구현하기 위함인데
이 Global Database 가 바로 이 목적을 충족 시킴과 동시에 지연을 최소화 할 수 있다는 점에서 두 국가의 서비스 이용자들이 해당 국가에서 빠르게 서비스를 이용 할 수 있도록 해 주는 기능도 같이 충족시켜 준다.

 

Global Database 에서 사용 할 수 있는 장애 대응 방법인 Switchover 와 Failover, Remove Region (독립 승격) 의 차이

 
Global Database 에서 사용 할 수 있는 장애 대응 방법은 아래와 같이 Switchover 와 Failover,  promotion (독립 승격) 이 있으며 각각 아래의 차이점이 있다.
 

출처 : 본인 테스트 화면

 

출처 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/AuroraUserGuide/aurora-global-database-managing.html


- Switchover (전환)
 
일반적인 Aurora Cluster 처럼, 각 Region 의 Cluster 를 Primary, Secondary 개념으로 자유롭게 promote 하면서 동기화가 유지되는 옵션이다. Failover 와 크게 차이를 보이는 특징은 Failover 와는 다르게, promote 가 되기 전 commit 되지 않았던 데이터에 대하여 동기화를 수행하기에 이에 따라 실제 promote 소요 시간이 Failover 보다 길다.
 
- Failover (장애 조치)

 

Switchover 와 동일한 promote 과정을 수행하지만, Switichover 와는 다르게 commit 되지 않은 데이터에 대해서는 동기화를 수행하지 않고 바로 promotion 을 수행한다. 즉, switchover 보다 더 빠른 promote 과정이 수행된다. Promote 이후에 Secondary Cluster 들은 승격된 primary cluster 와 다시 동기화를 시도한다.

 

- Remove from Global (독립 승격)

 

특정 Cluster 에 대하여 Switchover, Failover 와는 다르게 다른 Region Cluster 들간의 동기화를 끊고 독립 Cluster 로 만드는 과정이다. 한번 수행하면 다시 해당 Global Cluster 로 편입을 시킬 수 없다. 

 

DR 설계 시, Switchover 와 Failover 의 의의

 
각 기업또는 단체마다 DR 구조를 설계 시, Cluster 가 주로 사용되는 Region 의 Cluster 가 자연재해 또는 기타 재난으로 
어느정도까지 사용 불가 상태가 되느냐에 따라 Switchover, Failover, 독립 승격을 사용할지 결정된다.
 
만일 재난이 예측이 되어서 미리 다른 Region 으로 서비스 구성을 옮기거나 훈련 또는 기타 이벤트 대응으로 다른 Region 을 Primary 로 이용하고자 한다면 switchover 를 이용하는게 적절하다.

DR 같이 Primary 로 사용하는 Cluster 및 Region 내 데이터센터가 완전히 사용불가 상태가 되는 걸 가정한다면

Failover 또는 독립승격을 이용하는 게 좋다.

반응형
Comments