Showing posts with the label Prometheus

MSA 장애 분석을 위한 Observability 구현

마 이크로서비스 아키텍처(MSA)로의 전환은 서비스의 확장성과 배포 유연성을 높였지만, 동시에 디버깅과 장애 분석의 난이도를 기하급수적으로 증가시켰습니다. 모놀리식 환경에서는 단일 로그 파일이나 스택 트레이스만으로 원인을 파악할 수 있었으나, 수십 개의 서비스가 상호작용하는 분산 환경에서는 단순한 상태 확인(Health Check)만으로는 부족합니다. …
MSA 장애 분석을 위한 Observability 구현

未知の障害を特定するオブザーバビリティ設計

マ イクロサービスアーキテクチャへの移行が進むにつれ、開発者は一つの残酷な事実に直面します。それは「ダッシュボード上のCPUやメモリ使用率は正常値を示しているのに、特定のユーザーからレイテンシー悪化や500エラーの報告が絶えない」という状況です。サービス間通信が複雑化した現在、単一のノードの状態監視だけでは、システム全体の健全性を担保することは不可能です。本稿では、従来のモニタリングとオブザー…
未知の障害を特定するオブザーバビリティ設計
OlderHomeNewest