본문 바로가기
728x90

스터디 이야기78

모니터링 vs 관측가능성, 그리고 SLI·SLO·SLA 들어가며EKS와 같은 K8s 기반의 컨테이너 운영 환경에서의 서비스는 점점 더 복잡해지고 있습니다. 이렇게 복잡한 시스템이 안정적으로 운영되기 위해서는 모니터링(monitoring)과 관측가능성(observability)을 통해 서비스 장애를 빠르게 감지하고, 문제의 원인을 빠르게 파악하며 성능을 개선하기 위해 데이터 분석을 해야 합니다. 이 글에서는 모니터링과 관측가능성의 차이점, 주요 데이터 유형(메트릭, 로그, 트레이싱), 그리고 SLI, SLO, SLA 개념을 정리해보겠습니다. 모니터링과 관측가능성 모니터링관측가능성정의특정 메트릭을 추적하여 문제를 감지외부의 출력 데이터를 통해 시스템의 상태를 이해목표문제 발생 시 감지 및 알람문제 원을 진단하고 시스템을 최적화데이터 소스미리 정의된 매트릭(CPU.. 2025. 2. 28.
VolumeSnapshot & SnapScheduler로 Kubernetes 볼륨 자동 백업하기 들어가며Kubernetess 환경에서 PVC로 Storage를 만들어 관리한다면 백업(스냅샷)을 해야 하는 상황이 발생할 수 있고, 백업을 주기적으로 생성해야 하는 상황이 생길 수도 있는데요. 이를 위해 Kubernetes에서는 VolumeSnapshot을 통해 PVC의 특정 시점 데이터를 백업할 수 있고, SnapScheduler를 사용하면 주기적으로 자동으로 백업할 수도 있습니다. VolumeSnapshotVolumeSnapshot은 Kubernetes에서 PersistentVolumeClaim(PVC)의 특정 시점의 상태를 캡처하는 기능으로, 이를 통해 데이터를 백업하거나 복구할 수 있습니다.  VolumeSnapshotClass다양한 스토리지 백엔드에 대한 스냅샷 생성 정책을 정의합니다. apiV.. 2025. 2. 22.
Kubestr를 활용한 Kubernetes Storage 성능 테스트 서비스가 고도화되면서 데이터가 폭발적으로 증가함에 따라 빠르고 안정적인 스토리지의 중요성도 커지고 있습니다. 하지만 다양한 스토리지 옵션 중에서 어떤 스토리지가 가장 적합한지, 성능이 제대로 나오는지 판단하는 것은 쉽지 않습니다. 특히 Kubernetes 환경에서는 AWS EBS, Ceph, NFS, Local PV 등 여러 스토리지 옵션이 제공되지만 이들이 올바르게 설정되었는지 또는 원하는 성능을 제공하는지 확인하는 것이 중요합니다. 이번 글에서는 스토리지 개념과 주요 성능 지표, 그리고 Kubestr를 이용한 성능 테스트 방법을 다뤄보겠습니다.StorageStorage란?Storage는 데이터를 저장하는 모든 장치나 매체를 의미합니다. 특히 데이터를 영구적으로 보관할 수 있고, 전원이 꺼져도 데이터가.. 2025. 2. 19.
Kubernetes DNS: FQDN과 ndots의 동작 방식 정리 Kubernetes에서 ndots와 search 설정은 DNS 동작 방식을 결정짓는 중요한 요소입니다. 적절한 ndots 값을 설정하지 않으면 불필요한 DNS 요청이 증가하거나, 외부 도메인 접근에 문제가 발생할 수 있습니다.  FQDNFQDN이란?FQDN은 Fully Qualified Domain Name의 약자로, 특정 호스트를 인터넷이나 네트워크에서 고유하게 식별할 수 있는 전체적인 도메인 이름을 의미합니다. 특히, 호스트 이름과 도메인 이름이 결합된 형태로 네트워크 내에서 충돌 없이 특정 호스트를 고유하게 식별 가능한 절대 경로를 나타내는데, 주로 DNS 시스템에서 이름을 IP 주소로 변환할 때 사용됩니다.Kubernetes에서 FQDN...cluster.local Kubernetes에서 FQDN.. 2025. 2. 14.
AWS ECR과 EKS 연동을 통한 컨테이너 이미지 배포하기 OverviewAWS ECRECR(Elastic Container Registry)이란?AWS ECR(Amazon Elastic Container Registry)은 AWS에서 제공하는 완전 관리형 컨테이너 레지스트리 서비스로, Docker 및 OCI(Open Container Initiative) 기준에 맞춘 컨테이너 이미지와 artifact들을 안전하고 안정적으로 저장하며 관리할 수 있습니다. 주요 개념RegistryPublic Registrypublic.ecr.aws//:위와 같은 URL 형식을 가지며, 생성된 public 레지스트리는 Amazon ECR Public 갤러리에 공개되며, 공개적으로 접근할 수 있습니다.  Private Registryhttps://aws_account_id.dkr.e.. 2025. 2. 9.
AWS EKS Cluster Endpoint (Public, Private, Public+Private) EKS Cluster Endpoint EKS에는 2가지의 VPC 영역이 존재합니다.1. Control Plane을 AWS에서 관리하는 AWS VPC2. Data Plane을 사용자가 직접 관리하는 Customer VPC 이에 따라 AWS의 EKS에서는 사용자(고객)가 Control Plane을 관리하지 않고, 실질적으로 애플리케이션만 운영, 관리할 수 있게 Data Plane만 관리하게 하여 Customer VPC에만 집중할 수 있습니다.  이때, EKS 클러스터에 접근하기 위한 Cluster Endpoint에는 이래의 3종류가 존재합니다.Public: 인터넷을 통해 접근 가능Private: 내부 네트워크를 통해서만 접근 가능Public + Private: 퍼블릭과 프라이빗 환경 모두에서 접근 가능 On.. 2025. 2. 4.
[KANS] AWS EKS 더보기이 스터디는 CloudNet@에서 진행하는 KANS 스터디를 참여하면서 공부하는 내용을 기록하는 블로그 포스팅입니다.CloudNet@에서 제공해주는 자료들을 바탕으로 작성되었습니다. 이번 내용은 지난번에 참여한 스터디와 중첩되는 내용이 많아서 겹치는 내용은 링크로 대체 합니다.AWS VPC CNIhttps://lakescript.net/entry/AEWS-2-1-Amazon-EKS-Networking-CNI [AEWS] 2-1. Amazon EKS Networking - CNI사전 준비 더보기 위와 같이 사전 준비가 필요합니다. 저번 글에서 설명했듯이, EKS를 배포하기 위한 VPC를 생성하고, Public Subnet, Private Subnet을 생성합니다. 그 후 EKS Cluster에 접근하.. 2024. 11. 2.
[KANS] Cilium CNI 더보기이 스터디는 CloudNet@에서 진행하는 KANS 스터디를 참여하면서 공부하는 내용을 기록하는 블로그 포스팅입니다.CloudNet@에서 제공해주는 자료들을 바탕으로 작성되었습니다. Cilium CNI Cilium이란? Cilium CNI는 Kubernetes와 같은 컨테이너 오케스트레이션 플랫폼에서 네트워킹을 관리하는 데 사용되는 오픈 소스 네트워킹 플러그인입니다. 특히, Cilium은 eBPF(extended Berkeley Packet Filter)를 사용하여 네트워크 패킷을 커널 수준에서 처리할 수 있는 고성능 네트워킹 기능을 제공합니다.  즉, Cilium은 eBPF (Berkeley Packet Filter)를 기반으로 Pod Network 환경과 보안 을 제공하는 CNI Plugin입니.. 2024. 10. 26.
[KANS] Cilium CNI - eBPF 더보기이 스터디는 CloudNet@에서 진행하는 KANS 스터디를 참여하면서 공부하는 내용을 기록하는 블로그 포스팅입니다.CloudNet@에서 제공해주는 자료들을 바탕으로 작성되었습니다.eBPFeBPF란? eBPF는 Extended Berkeley Packet Filter의 약자로 네트워크 패킷 필터링, 성능 모니터링, 보안 등 커널 내에서 실행되는 프로그램입니다. 특히, 운영 체제 커널과 같은 특별한 권한이 있는 환경에서 샌드박스 프로그램을 실행할 수 있습니다. 이때, 커널 소스 코드를 수정하거나  커널 모듈을 로드하지 않고도 기존의 커널 기능을 안전하고 효율적으로 확장시키는 것에 사용됩니다.샌드박스 프로그램(Sandbox Program)주로 보안과 관련된 개념으로, 격리된 환경에서 특정 프로그램이나 .. 2024. 10. 23.
728x90