Showing posts with the label Observability

Linuxカーネルランタイム拡張技術eBPFによる低レイテンシネットワーク構築

プロダクション環境において、マイクロサービスの通信レイテンシが突発的に上昇する現象に遭遇した際、従来のLinuxネットワークスタック(iptablesやconntrack)がボトルネックとなるケースが増加しています。数万規模のKubernetes Serviceが存在する場合、iptablesの…
Linuxカーネルランタイム拡張技術eBPFによる低レイテンシネットワーク構築

오픈텔레메트리 기반 통합 관측가능성 아키텍처

마이크로서비스 환경에서 500 Internal Server Error 가 발생했을 때, 가장 큰 비용은 '수정'이 아니라 '원인 파악'에 소모됩니다. 서비스 A의 로그에는 에러가 없는데 서비스 B는 타임아웃을 뱉고, 서비스 C의 DB 커넥션 풀이 고갈되는 현상. 이를 해결하기 위해 개발자는 Kibana(로그), Grafan…
오픈텔레메트리 기반 통합 관측가능성 아키텍처

Unified Observability Architecture with OpenTelemetry

In complex microservices architectures, the "Mean Time to Resolution" (MTTR) is often dominated not by fixing the bug, but by locating it…
Unified Observability Architecture with OpenTelemetry

OpenTelemetryによる統合可観測性基盤の設計

マイクロサービスアーキテクチャにおける最大の課題は、サービス間の境界を越えたトランザクションの追跡不能性にある。特定のAPIエンドポイントでレイテンシが急増した際、それがDBのロック待ちによるものか、下流サービスのGCによる停止なのか、あるいはネットワークのパケットロスなのかを即座に特定できない場合、そのシステムは「観測不能(Unobservable)」である。従来のAPM(Applicat…
OpenTelemetryによる統合可観測性基盤の設計
OlderHomeNewest