반응형

CloudWatch 경보

지표 경보는 단일 CloudWatch 지표를 모니터링합니다. 경보는 일정 기간에 걸쳐 특정 입계값과 관련된 지표 값을 기반으로 하나 이상의 작업을 수행합니다. 작업은 EC2 작업, 자동 크기 조정 작업 또는 Simple Notification Service(SNS) 주제로 전송된 알림일 수 있습니다.

 

경보 상태

가능한 경보 상태는 다음 3 가지입니다.

  • OK - 지표가 정의된 임계값 내에 있습니다.
  • ALARM - 지표가 정의된 임계값을 벗어났습니다.
  • INSUFFICIENT_DATA - 경보가 방금 시작되었거나, 지표를 사용할 수 없거나, 지표를 통해 경보 상태를 결정하는 데 사용할 충분한 데이터가 없습니다.

ALARM은 상태에 부여된 이름일 뿐이며 즉각적인 주의가 필요한 비상 상황을 반드시 알리는 것은 아닙니다. 모니터링되는 지표가 지정된 임계값과 같거나, 그보다 크거나 작다는 의미입니다. 예를 들면 지정된 EC2 인스턴스의 CPU 사용률이 너무 높을 때를 알려 주는 경보를 정의할 수 있습니다. 인스턴스에서 CPU 집약적 작업을 중단하도록 이 알림을 프로그래밍식으로 처리할 수 있습니다. 그리고 조치를 취하라는 알림을 전송하여 애플리케이션 소유자에게 상황을 알릴 수도 있습니다.

 

지정된 지표에 대한 데이터가 없을 경우 INSUFFICIENT_DATA가 반환될 수 있습니다. 빈 Simple Queue Service(SQS) 대기열의 깊이를 예로 들 수 있습니다. 이러한 결과는 시스템에 문제가 있다는 징후일 수 있습니다.

 

경보 구성 요소

지표 수학 표현식을 기준으로 경보를 생성하려면 표현식에 사용할 CloudWatch 지표를 하나 이상 선택합니다. 그런 다음 표현식, 임계값 및 평가 기간을 지정합니다.

 

  • 통계
    지정된 기간 동안의 지표 데이터 집계입니다. 지표 경보에서는 통계 하나에서 지표 데이터가 평가됩니다. 선택 가능한 일반적인 통계로는 샘플 수, 합계, 평균, 최대값, 최소값, 백분위수 등이 있습니다.
  • 기간
    경보용으로 개별 데이터 요소를 생성하기 위해 지표나 표현식에서 평가할 시간의 길이이며 초 단위로 표시됩니다. 기간으로 1분을 선택하면 경보는 1분마다 한 번씩 지표를 평가합니다.
  • 평가 기간
    경보 상태를 결정할 때 평가할 가장 최근 기간 또는 데이터 요소의 수입니다. 예를 들어 2/2이라면 최근 2회의 수치가 연속으로 임계값을 넘었다면 ALARM 상태로 넘어갑니다.
  • 경보를 생성할 데이터 요소
    경보가 ALARM 상태가 되려면 위반되어야 하는 평가 기간 내의 데이터 요수 수입니다. 위반 데이터 요소가 연속할 필요는 없지만, 모든 데이터 요소는 평가 기간과 일치하는 데이터 요소의 마지막 숫자 범위 내에 있어야 합니다.

상세

 

EventBridge

EventBridge 사용 시에는 지점 간 통합을 번거롭게 작성할 필요가 없습니다. 확장성이 우수한 중앙 이벤트 스트림을 통해 AWS와 서비스형 소프트웨어(SaaS) 애플리케이션에서 적용된 데이터 변경 사항에 모두 액세스할 수 있기 때문입니다.

 

CloudWatch에서 캡처된 이벤트를 관리할 때는 기본적으로 EventBridge를 사용합니다. CloudWatch Events 및 EventBridge의 기본 서비스와 API는 동일하지만 EventBritdge에서 더 많은 기능이 제공됩니다. CloudWatch 또는 EventBridge에서 적용하는 변경 사항은 각 콘솔에 표시됩니다.

 

EventBridge를 사용하면 이벤트 게시자가 이벤트 구독자와 디커플링되는 간단한 프로그래밍 모델을 얻을 수 있습니다. 그러면 느슨하게 결합되고, 독립적으로 크기를 조정할 수 있으며, 재사용성이 높은 이벤트 중심 애플리케이션을 구축할 수 있습니다.

 

EventBridge는 완전 관리형 서비스로 이벤트 수집과 전달 과정에서 보안, 권한 부여 및 오류 처리에 이르기까지 모든 것을 처리합니다. 따라서 확장 가능한 이벤트 중심 애플리케이션을 구축할 수 있습니다. EvnetBridge는 서버리스이므로 관리할 인프라가 없으며 사용한 이벤트에 대해서만 비용을 지불하면 됩니다. 비용 요소는 사용자의 애플리케이션이나 SaaS 애플리케이션에서 생성하는 이벤트에 대한 비용 등이 있습니다.

 

EventBridge에서 수행할 수 있는 작업을 요약하면 다음과 같습니다.

  • 메시지를 보내 환경에 대응합니다.
  • 함수를 활성화하거나 작업을 시작합니다.
  • 상태 정보를 캡처합니다.

EventBridge를 활용하기 위해 고려해야할 수 있는 사항은 다음과 같습니다.

  • EC2 인스턴스의 CPU 사용률이 높은 경우 EventBridge를 사용하여 대응 자동화를 위해 호출할 수 있는 다른 작업이 있는가?
  • AWS 서비스에는 작업을 수행하는 동안 트래픽을 리디렉션하는 데 사용할 수 있는 도구가 있는가?
  • CPU 사용률이 너무 높아서 발생하는 이벤트를 방지하기 위해 어떻게 확장을 할 수 있는가?
반응형

'자격증 > AWS SAA' 카테고리의 다른 글

[AWS SAA] 36. 자동 크기 조정  (0) 2023.08.31
[AWS SAA] 35. Elastic Load Balancing(ELB)  (0) 2023.08.30
[AWS SAA] 33. AWS Log 서비스  (0) 2023.08.28
[AWS SAA] 32. CloudWatch  (0) 2023.08.27
[AWS SAA] 31. Database 마이그레이션  (0) 2023.08.26