
5
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
이 게시물은 AWS Big Data Blog의 "Improved resiliency with backpressure and admission control for Amazon OpenSearch Service"를 번역 및 편집한 글입니다.
요약
- Search Backpressure — 노드의 CPU 시간, 힙 할당, 경과 시간 등을 주기적으로 측정하고 각 검색 작업에 취소 점수 할당, 높은 점수 작업을 우선 취소
- 취소된 검색은 HTTP 429 응답 반환, 일부 샤드 실패 시 부분 결과 허용
- 모니터링 — _nodes/stats/search_backpressure API 및 CloudWatch 매트릭(SearchTaskCancelled, SearchShardTaskCancelled) 활용
- CPU 기반 Admission Control — 각 노드의 평균 CPU 사용량 기반으로 _search 및 _bulk 요청 사전 제한, 과도한 요청 거부 시 HTTP 429 반환
- 권장 대응 — 클라이언트 측 지수 백오프와 지터 기반 재시도 및 AWS 문제 해결 가이드 참고

