DB & AWS Knowledge
관제, 모니터링 (Monitoring) 본문
이번 페이지에서는 DB 관제, 모니터링에 대해서 다루도록 한다.
관제 (모니터링)의 개념과 관제는 왜 중요한가?
모니터링은 그렇게 생소한 단어가 아니다. IT 영역뿐만이 아니더라도 일상생활에서 모니터링이라는 말은 꽤나 심심치 않게 사용한다. 감시, 관찰을 뜻하는 모니터링이라는 단어에 맞게 이 단어가 쓰이는 경우는 어떤 현상이나 이슈들과 엮여서 자주 쓰인다. (예를 들어, 어떤 정책이나 사회현상에 대해서 모니터링을 하다 라거나 가수, 배우들이 자신이 촬영된 영상을 보면서 개선해야 될 점이 있는지 보기위해 모니터링하다 라는 용도로 쓰이는 등)
IT 영역에서도 모니터링은 이와 유사하게 사용하는데 특히, 서버 down 이나 기능 수행 불능 상태를 유발시킬 수 있는 요소들을 미리 탐지하거나 해당 이슈가 발생했을 때, 이를 유발시킨 요소를 찾아내기 위해 사용하는 용어다.
사실 실무에서는 모니터링이라는 용어보다는 관제라는 실무 용어를 더 많이 사용한다. 모니터링을 먼저 언급한 이유는 일상생활에서 모니터링이라는 단어가 관제라는 단어보다는 덜 생소하기 때문에 언급한 것이다.
IT 영역에서 관제 대상은 서비스 단위일 수도 있고 더 세부적으로 개발 code 영역 혹은 인프라까지 다양하다. 이중에서 DB 영역은 특히나 타 영역 대비 문제가 발생하면 이에 대한 타 영역에 악영향을 미치는 정도가 크고, 데이터 손실등의 최악의 문제가 발생하면 서비스 전체가 불능 상태에 빠질수 있는등의 매우 심각한 상황까지 번질 수 있기에 이에 대한 관제 설정이 매우 중요하다.
DB 관제 대상
DB 내에서 관제로 설정되는 항목은 회사마다 다르다. 그러나 공통적으로 반드시 설정을 하는 항목이 몇개가 있으며, 그 항목들은 아래와 같다.
- DB 프로세스
DB 도 OS 에서는 하나의 SW 다. 즉, 사용자인 우리가 실행을 시켜야하는 대상이라는 뜻이다. 이렇게 실행된 DB 는 상시 실행이되고 있어야 서비스 내의 다른 영역들이 사용을 할 수가 있다. 그러나 DB 가 실행되는 중 예상치 못한 원인들로 인하여 DB 가 꺼질 수 있다. 만약 운영중인 서비스에서 DB 가 내려간다면? 이는 장애상황이기에 다시 사용자가 수행을 시켜 주든 이에 대한 자동 재기동 logic 을 만들든 설정을 해줘야 한다. 이를 위해서는 프로세스가 정상기동 상태인지를 봐야 하기에 관제를 설정하는 것이다.
- CPU, MEMORY 사용량 (서버 자원 사용량)
우리가 일상적으로 컴퓨터에서 사용하는 프로그램들은 부하 여부에 따라 컴퓨터의 자원인 CPU, Memory 를 더 쓸수도 있고, 덜 쓸 수도 있다. 운영 서비스 사용 부하가 늘어나면 이에 따른 DB 도 마찬가지로 부하가 늘어나게 된다. 이에 따라 OS 나 타 중요 프로세스가 SW 인 DB 보다 자신의 정상 기동상태 유지를 더 중요하게 판단하여 DB 를 강제 중지 시키거나 OS 자체적으로 기동중지가 되는 심각한 이슈가 발생 할 수 있다. 이를 예방하기 위해서 관제를 설정한다.
- 디스크 사용량
데이터를 보관하는 디스크 용량이 얼마나 사용되었는지에 대하여 설정하는 항목이다. 보통은 일정 임계치까지는 관제알림이 발생하지 않다가 임계치 (회사마다 설정한 임계치는 다르다. 필자 소속 회사는 80% 정도를 경고 알림 90% 이상을 위험 알림으로 알린다.) 에 다다르게 되면 관리자들에게 이에 대한 알림을 발생시키게 한다. 디스크 사용량이 100%가 되면 기동 중지 혹은 심각하면 데이터 유실까지 발생하기에 유심히 봐야 할 항목 중 하나다.
- DB 커넥션 개수
사용자가 DB 에 접속하여 맺어진 연결 (커넥션)의 개수를 보는 항목이다. 모든 DB 는 위의 부하에 따른 서버 자원량을 고려해야 하기 때문에 외부 사용자를 무한정 받을 수가 없고 이에 따라 최대 허용 커넥션 개수가 설정 된다. 당연히 최대 허용 커넥션 개수 이상의 사용자가 DB에 접속하려고 하면 접속이 되지 않으므로 이에 따른 서비스 사용 불가를 겪게 되기에 이에 대한 상황이 발생하기 전, DB 최대 접속 허용에 따른 커넥션 개수가 임계치에 다다르는지를 확인 해야 한다.
이 기본항목들에서 시작하여 관제가 설정되는 DB 종류에 따라 추가항목들을 설정하게 된다.
'DB 관련 지식 > DB 기본 개념' 카테고리의 다른 글
Dead Lock 개념 (0) | 2024.01.24 |
---|---|
latch, mutex, enqueue (0) | 2023.06.16 |
Physical Replication 과 Logical Replication (0) | 2023.05.12 |
리두 로그 (Redo Log) (0) | 2021.04.06 |
인덱스 (Index) (0) | 2021.03.09 |