본문 바로가기
클라우드/쿠버네티스

블로그: Kafka, 어디에 올려야 할까? VM vs 쿠버네티스, 국내 기업들의 선택은?

by gasbugs 2025. 9. 18.

안녕하세요! 👋 오늘은 데이터 파이프라인의 심장, Apache Kafka를 운영 환경에 어떻게 배포해야 할지에 대한 깊은 고민을 함께 나눠보려 합니다.

 

개발자 커뮤니티에서 늘 뜨거운 감자인 "VM이냐, 쿠버네티스냐" 하는 논쟁! 과연 Kafka를 위한 최적의 보금자리는 어디일까요? 특히 국내의 내로라하는 기업들은 어떤 선택을 하고 있을까요? 지금부터 상세하게 파헤쳐 보겠습니다. 낱낱이요! 😉

 


🤔 문제의 시작: 왜 고민하게 될까?

과거 Kafka는 Zookeeper에 대한 강한 의존성과 자체적인 클러스터링 방식 때문에 "상태를 가진(Stateful) 애플리케이션의 끝판왕"으로 불렸습니다. 이런 특성 때문에 예측 가능하고 안정적인 가상 머신(VM) 환경이 오랫동안 당연한 선택지로 여겨졌죠.

하지만 클라우드 네이티브와 마이크로서비스 아키텍처(MSA)가 대세가 되면서, 모든 애플리케이션을 쿠버네티스(Kubernetes)라는 단일 플랫폼 위에서 관리하고 싶은 강력한 유혹이 생겨났습니다.

과연 복잡한 Kafka를 쿠버네티스 위에서 잘 운영할 수 있을까요? 국내 기업들의 사례를 통해 그 답을 찾아보시죠!

🌊 새로운 물결: 쿠버네티스, 대세가 되다

결론부터 말하자면, 최신 기술 트렌드는 명확히 쿠버네티스로 기울고 있습니다. 특히 기술을 선도하는 국내 IT 대기업과 스타트업을 중심으로 Kafka on Kubernetes는 이제 '실험'이 아닌 '표준'으로 자리 잡고 있습니다.

 

✨ 게임 체인저의 등장: 오퍼레이터(Operator)

이러한 변화의 중심에는 StrimziConfluent Operator 같은 '오퍼레이터'가 있습니다.

💡 잠깐! 오퍼레이터가 뭔가요? 쿠버네티스 지식을 가진 자동화된 운영 로봇이라고 생각하면 쉬워요. Kafka 클러스터의 설치, 업그레이드, 스케일링, 장애 복구 등 인간 운영자가 하던 복잡한 작업을 코드로 자동화해주죠. 관리자는 "브로커 3개 만들어줘!"라고 YAML 파일에 선언만 하면, 오퍼레이터가 마법처럼 모든 것을 처리해줍니다.

이 오퍼레이터 덕분에 우리는 다음과 같은 엄청난 이점을 누릴 수 있게 되었습니다.

  • ⚡️ 빛의 속도로 확장: 트래픽이 몰릴 때 간단한 명령어로 몇 분 안에 브로커를 추가할 수 있습니다.
  • ❤️ 자동 복구 (Self-Healing): 특정 노드에 문제가 생겨도 쿠버네티스가 알아서 새로운 Kafka Pod을 띄워 서비스를 유지합니다.
  • 🧩 통합된 관리: 다른 MSA 애플리케이션과 동일한 방식으로 Kafka를 배포, 모니터링, 로깅할 수 있어 DevOps 파이프라인이 깔끔해집니다.

 

🇰🇷 국내 대표 기업들의 선택 (AI로 생성한 데이터로 사실과 다를 수 있습니다.)

  • 카카오 (Kakao) 💬 카카오는 전사적으로 사용하는 대규모 공용 Kafka 클러스터를 운영하며, 수많은 서비스들의 데이터를 실시간으로 연결합니다. 카카오의 많은 서비스들이 쿠버네티스 기반으로 운영되는 만큼, Kafka 역시 클라우드 네이티브 환경에 맞춰 진화하고 있습니다. 대규모 트래픽을 안정적으로 처리하는 그들의 노하우는 쿠버네티스 환경에서의 Kafka 운영 가능성을 증명합니다.
  • 우아한형제들 (배달의민족) 🛵 '주문'이라는 핵심 비즈니스 로직에서 발생하는 수많은 이벤트를 처리하기 위해 Kafka를 깊숙이 사용합니다. MSA의 정석과도 같은 배달의민족 기술 스택에서 Kafka는 서비스 간의 비동기 통신을 책임지는 핵심 동맥 역할을 합니다. 이들의 인프라는 대부분 쿠버네티스 위에서 유연하고 탄력적으로 운영되고 있습니다.
  • 라인 (LINE) 💚 라인 역시 대규모 메시징 데이터를 처리하기 위해 Kafka를 핵심 인프라로 사용합니다. 특히 쿠버네티스 환경에서 관리 및 모니터링 기능이 강화된 Confluent Platform을 활용하여 데이터 파이프라인을 고도화한 사례는 매우 인상적입니다. 이는 단순한 오픈소스를 넘어, 쿠버네티스 생태계와 긴밀하게 통합된 솔루션을 통해 운영 효율성을 극대화하고 있음을 보여줍니다.

🏛️ 전통의 강자: 가상 머신(VM), 여전히 건재하다

물론 모든 기업이 쿠버네티스라는 새로운 물결에 합류한 것은 아닙니다. 안정성예측 가능성이 무엇보다 중요한 환경에서는 여전히 VM이 최고의 선택지입니다.

💪 VM 기반 Kafka의 강점

  • 🪨 검증된 안정성: 오랜 기간 사용된 방식인 만큼, 운영 중에 예기치 못한 문제가 발생할 확률이 낮습니다. 성능 예측이 쉽고, 문제가 발생했을 때 원인을 파악하기도 상대적으로 수월합니다.
  • 🕹️ 완벽한 통제권: OS 커널 파라미터부터 디스크 I/O 스케줄러까지, 인프라의 모든 요소를 직접 제어하며 성능을 극한까지 튜닝할 수 있습니다.
  • 👨‍💻 낮은 진입 장벽: 쿠버네티스의 복잡한 개념(StatefulSet, PV, PVC, CNI...)을 몰라도 전통적인 인프라 관리 지식만으로 접근이 가능합니다.

🇰🇷 이런 조직들이 선호해요

  • 금융 및 공공 기관 🏦: 단 1초의 장애도 치명적일 수 있는 금융권이나 공공기관에서는 새로운 기술 도입에 보수적일 수밖에 없습니다. 이들은 쿠버네티스의 유연성보다는 VM 환경의 격리성과 안정성에 더 높은 가치를 둡니다. Ansible, Chef 같은 도구로 자동화를 구현하며 안정적으로 클러스터를 운영합니다.
  • 대규모 엔터프라이즈 🏭: 삼성전자와 같은 거대 기업의 내부 데이터 플랫폼에서는 수많은 데이터를 처리하기 위해 Kafka를 사용합니다. 이런 환경에서는 극도의 안정성과 성능을 위해 VM이나 물리 서버(Bare Metal)에서 직접 클러스터를 구축하고 세밀하게 제어하는 방식을 택하기도 합니다.

🚀 제3의 선택: 관리형 서비스(Managed Service)

"쿠버네티스도, VM도 직접 운영하기는 부담스러워요!"라고 생각하는 분들을 위한 최고의 선택지도 있습니다. 바로 클라우드 서비스 제공업체(CSP)가 제공하는 관리형 Kafka 서비스입니다.

  • 대표 서비스: AWS의 MSK, GCP의 Pub/Sub(유사) 또는 Confluent Cloud, 네이버 클라우드 플랫폼의 Cloud Data Streaming Service 등
  • 장점: 클릭 몇 번이면 Kafka 클러스터가 뚝딱 만들어집니다. 설치, 패치, 모니터링, 장애 복구 등 골치 아픈 운영은 모두 클라우드 업체가 알아서 해줍니다. 우리는 오직 데이터 처리에만 집중하면 됩니다.
  • 누가 쓸까?: 자체 인프라 운영 인력이 부족하거나, 최대한 빨리 서비스를 출시하고 싶은 스타트업, 비즈니스 로직에 집중하고 싶은 모든 기업에게 훌륭한 대안입니다.

📊 한눈에 비교하기: 나에게 맞는 선택은?

구분 쿠버네티스 (Kubernetes) 가상 머신 (VM) 관리형 서비스 (Managed)
핵심 키워드 자동화, 탄력성, MSA 안정성, 예측 가능성, 통제 편의성, 속도, 운영 부담 제로
장점 빠른 확장, 자동 복구 검증된 안정성, 세밀한 튜닝 최고 수준의 편의성
단점 높은 학습 곡선, 복잡성 느린 확장, 운영 오버헤드 벤더 종속성, 높은 비용
추천 대상 기술 스타트업, DevOps 조직 금융/공공 기관, 대기업 빠른 개발이 필요한 모든 조직
 

🎉 결론: 정답은 없지만, 방향은 있다

지금까지 살펴본 것처럼 Kafka를 서비스하는 방식에는 정답이 없습니다. 각 조직의 상황과 목표에 맞는 최적의 선택이 있을 뿐입니다.

  • 미래의 표준을 따르고 싶다면? 👉 쿠버네티스 우리 회사가 MSA와 DevOps 문화를 지향하고, 클라우드 네이티브 환경에서 빠르게 성장하고 싶다면 쿠버네티스는 거스를 수 없는 대세입니다.
  • 안정성이 무엇보다 중요하다면? 👉 가상 머신(VM) 우리 서비스는 절대 죽으면 안 되고, 예측 가능한 성능이 중요하며, 쿠버네티스 전문가가 없다면 검증된 VM 방식이 현명한 선택입니다.
  • 운영보다 개발에 집중하고 싶다면? 👉 관리형 서비스 인프라 걱정 없이 비즈니스 로직 개발에만 온전히 집중하고 싶다면, 비용을 조금 더 지불하더라도 관리형 서비스가 최고의 선택이 될 것입니다.

이 글이 여러분의 조직에 딱 맞는 Kafka 보금자리를 찾는 데 도움이 되었기를 바랍니다! 😊


Tags

Kafka, Kubernetes, VM, 카프카, 쿠버네티스, 가상머신, Strimzi, MSA, DevOps, 클라우드 네이티브, 데이터 파이프라인, 국내 기술 트렌드, 카카오, 우아한형제들, 라인