728x90 Log2 모니터링 vs 관측가능성, 그리고 SLI·SLO·SLA 들어가며EKS와 같은 K8s 기반의 컨테이너 운영 환경에서의 서비스는 점점 더 복잡해지고 있습니다. 이렇게 복잡한 시스템이 안정적으로 운영되기 위해서는 모니터링(monitoring)과 관측가능성(observability)을 통해 서비스 장애를 빠르게 감지하고, 문제의 원인을 빠르게 파악하며 성능을 개선하기 위해 데이터 분석을 해야 합니다. 이 글에서는 모니터링과 관측가능성의 차이점, 주요 데이터 유형(메트릭, 로그, 트레이싱), 그리고 SLI, SLO, SLA 개념을 정리해보겠습니다. 모니터링과 관측가능성 모니터링관측가능성정의특정 메트릭을 추적하여 문제를 감지외부의 출력 데이터를 통해 시스템의 상태를 이해목표문제 발생 시 감지 및 알람문제 원을 진단하고 시스템을 최적화데이터 소스미리 정의된 매트릭(CPU.. 2025. 2. 28. [Loki 기반 Logging Monitoring System 구축] Chunks 생성과 Flush 동작 구조 기존에 구성되어있던 시스템의 불편함기존에는 사용하고 있던 Logging System은 Elastic Stack을 통해 구성되어있었습니다. 각 node에 daemonset으로 배포되어 있는 filebeat를 통해 STDOUT으로 출력되는 로그를 수집하고, 버퍼 역할을 하는 Kafka에게 로그를 전달하며 ElasticSearch를 통해 집계하여 Kibana로 대시보드를 구성하여 로그를 확인하는 시스템이었습니다. 하지만 elasticsearch에는 큰 단점으로 느꼈던 점은 사전에 index를 꼭 설정해줘야 한다는 점과, timestamp로 매핑되지 않는다는 것이었습니다. 특히, 개발팀에서 수집이 되어야 하는 로그가 다양하고, key를 추가할수도, 삭제할 수도 있는데 이를 애플리케이션마다 index를 다르게 .. 2025. 1. 28. 이전 1 다음 728x90