prometheus9 🚀 Argo Rollouts 배포 전략 완벽 가이드: 무중단 배포의 모든 것 쿠버네티스 환경에서 서비스를 중단 없이, 그리고 안전하게 배포하는 것은 모든 엔지니어의 꿈이죠. 오늘은 그 꿈을 현실로 만들어주는 강력한 도구, Argo Rollouts의 핵심 전략들을 아주 깊이 있게 파헤쳐 보겠습니다.단순한 이론을 넘어 실무에서 어떤 전략을 선택해야 할지 가이드라인까지 준비했으니, 10분만 집중해 주세요! 🚀 쿠버네티스 기본 Deployment 리소스는 'RollingUpdate'라는 훌륭한 기능을 제공하지만, 트래픽 제어나 세밀한 검증에는 한계가 있습니다. Argo Rollouts는 이를 보완하여 대규모 서비스에서도 안심하고 배포할 수 있는 다양한 전략을 제공합니다.1. Blue-Green 배포: 완벽한 전환과 즉각적인 롤백 🔵🟢블루-그린 배포는 구버전(Blue)과 신버전(Gr.. 2026. 1. 3. 개발자 필독! 🤯 MSA 지옥에서 날 구해준 OpenTelemetry 완벽 가이드 "내 코드는 분명 잘 돌아가는데, 왜 전체 서비스는 느릴까?" "A 서비스에서 B 서비스 호출할 때 어떤 파라미터가 넘어갔더라?"마이크로서비스 아키텍처(MSA)가 복잡해질수록, 장애의 원인을 찾거나 성능 병목을 분석하는 것은 점점 더 어려워집니다. 마치 거대한 미로 속에서 길을 잃은 기분이죠. 😭 이런 '관측 가능성(Observability)'의 위기 속에서, OpenTelemetry (줄여서 Otel)는 우리에게 구원의 동아줄이 되어줍니다. 오늘은 MSA 지옥에서 길을 잃은 개발자들을 위해 OpenTelemetry의 모든 것을 A to Z로 파헤쳐 보겠습니다!🤔 그래서 OpenTelemetry가 정확히 뭔가요?OpenTelemetry는 관측 가능성 데이터를 생성하고 수집하는 방법을 표준화한 오픈소스.. 2025. 11. 9. 🚨 Pushgateway 사용 시 주의! 사라지지 않는 좀비 메트릭 👻 안녕하세요! 오늘은 Prometheus 생태계에서 단기 실행 작업(short-lived jobs)의 메트릭을 수집하는 데 유용한 도구인 Pushgateway에 대해 이야기해 보려고 합니다. Pushgateway는 Cron Job, 배치 작업(Batch Job)처럼 수명이 짧아 Prometheus가 직접 메트릭을 수집(pull)하기 어려운 대상의 데이터를 효과적으로 모니터링할 수 있게 해줍니다. 하지만 이 편리한 도구에는 우리가 꼭 알아야 할 함정이 숨어있습니다. 바로 "오래된(Stale) 메트릭" 또는 "좀비 메트릭" 문제입니다. 🤔 Pushgateway는 어떻게 동작하나요?Pushgateway의 핵심 동작 방식은 '캐시(Cache)' 와 같습니다.작업 시작 🚀: 배치 작업이나 임시 작업이 실행됩니다.. 2025. 10. 12. 프로메테우스(Prometheus) on() vs ignoring(): 벡터 매칭의 두 얼굴 🎭 안녕하세요! 오늘은 프로메테우스 쿼리 언어(PromQL)에서 매우 중요하지만 헷갈리기 쉬운 두 가지 키워드, on()과 ignoring()에 대해 자세히 알아보겠습니다. 이 둘은 벡터(vector) 간의 연산을 수행할 때 어떤 레이블을 기준으로 매칭할지 결정하는 역할을 합니다. 정확한 쿼리를 작성하기 위해선 이 둘의 차이점을 명확히 이해하는 것이 필수적입니다! 🎯 on(): "이 레이블만 보고 매칭해!"on()은 지정한 레이블 목록이 정확히 일치하는 시계열 데이터끼리 연산을 수행하라고 지시하는 키워드입니다. on()에 명시되지 않은 다른 모든 레이블은 매칭 과정에서 완전히 무시됩니다.on()의 작동 방식명시적 지정: 매칭에 사용할 레이블을 직접, 명확하게 지정합니다.화이트리스트 방식: "이 목록에 있.. 2025. 10. 12. 🚀 골든 쿠버스트로넛을 향한 여정 (6/15): PCA 합격, 모니터링의 신세계를 맛보다! (feat. PromQL과의 사투) 안녕하세요! '골든 쿠버스트로넛'이라는 원대한 목표를 향해 한 걸음씩 나아가고 있는 gasbugs입니다. CKS 합격으로 '쿠버스트로넛'이라는 첫 이정표를 달성한 지 얼마 지나지 않아, 곧바로 여섯 번째 관문인 PCA(Prometheus Certified Associate) 시험에 도전하고 짜릿한 합격 소식을 들고 왔습니다! 🥳 클러스터를 안전하게 지키는 법(CKS)을 익혔으니, 이제 클러스터의 상태를 샅샅이 들여다보고 관찰하는 '눈'을 가져야 할 차례라고 생각했습니다. 그 핵심에는 단연코 프로메테우스가 있었죠. 하지만 솔직히 고백하자면, 이번 도전은 그야말로 '무모함' 그 자체였습니다.🤯 "이건 떨어진다..." 하루 만의 도전, 그리고 운명의 86점사실 최근에는 프로메테우스 룰 세팅 같은 실무를 직.. 2025. 10. 12. 📊 히스토그램 vs 서머리: 당신의 선택은? 서버냐 클라이언트냐, 그것이 문제로다! 안녕하세요! 오늘은 모니터링 시스템, 특히 프로메테우스(Prometheus)와 같은 시스템에서 자주 사용되는 두 가지 중요한 메트릭 타입, 히스토그램(Histogram)과 서머리(Summary)의 결정적인 차이점에 대해 알아보려고 합니다. 둘 다 요청 지연 시간(request latency)이나 응답 크기(response size)와 같은 값의 분포를 측정하는 데 사용되지만, 동작 방식에는 아주 중요한 차이가 있습니다. 바로 어디서 계산이 이루어지느냐 하는 점이죠! 🤔 🚀 핵심 차이점: 계산의 주체결론부터 말씀드리자면, 둘의 가장 큰 차이점은 다음과 같습니다.히스토그램 (Histogram): 데이터 수집 및 계산이 서버 측(Server-side)에서 이루어집니다. 🖥️서머리 (Summary): 데이.. 2025. 10. 11. 이전 1 2 다음