로그 데이터 양이 급증하면서 Elasticsearch 클러스터가 갑자기 느려지거나 Out of Memory(OOM) 에러로 중단되는 상황을 자주 겪습니다. 대부분의 원인은 통제되지 않은 필드 생성으로 인한 매핑 폭발(Mapping Explosion)과 잘못된 샤드(Shard) 설계에 있습니다. 이 가이드에서는 클러스터의 안정성을 보장하고 검색 속도를 …
최근 운영 중인 로그 분석 클러스터에서 심각한 성능 저하가 발생했습니다. 평소 200ms 내외였던 검색 레이턴시가 트래픽이 몰리는 피크 시간대에 3초 이상 치솟았고, 심한 경우 타임아웃(Timeout)이 발생해 Kibana 대시보드가 먹통이 되는 현상이 반복되었습니다. 인프라 환경은 AWS r5.2xlarge(64GB RAM) 노드 3대로 구성되어 있…