🎥 AI 시대 옵저버빌리티 전략 웨비나 | 무료 다시보기 (~4/9)
Top
도입문의
2026-04-29

글로벌 디지털 자산 인프라 기업 웨이브릿지, 풀스택 모니터링으로 전환한 이유

회사명
웨이브릿지(Wavebridge)
산업
금융/핀테크
웹사이트
https://wavebridge.com/ko
장애 원인 파악 시간이 기존 30분~1시간에서 5~10분 이내로 크게 단축되었습니다. 모니터링을 와탭에 위임하고, 확보된 리소스를 IaC 전환이나 개발 환경 개선 등 본질적인 기술 고도화에 집중하고 있습니다.
장원엽
DevOps Team Lead

반도체 슈퍼사이클 속에서, 삼성전자와 SK하이닉스는 2025년 하반기 각각 110%, 200%대의 기록적인 상승률을 보이며 코스피 사상 첫 5,000선 시대를 견인했습니다. 전통 자산 시장이 유례없는 호황을 구가하는 사이, 디지털자산 시장 역시 구조적 전환을 맞고 있습니다.

세계 최대 디지털자산 운용사 그레이스케일(Grayscale)은 2026년을 ‘기관 투자 시대의 본격적인 개막’으로 규정했으며, 전 세계 기관투자자의 76%가 가상자산 비중 확대를 계획하고 있습니다.

골드만삭스와 블랙록이 디지털자산을 프라임 브로커리지(Prime Brokerage) 서비스(기관 투자자를 위해 거래·보관·대출·리스크 관리를 통합 제공하는 금융 인프라 서비스)에 통합하기 시작한 지금, 디지털자산 인프라도 24/7 무중단 운영, 실시간 트랜잭션 추적, 장애 시 즉각적인 원인 분석 등 전통 금융 수준의 안정성과 신뢰를 요구받고 있습니다.

국내 기업 중 글로벌 프라임브로커의 운영 기준을 실제로 내재화하며, 한국 기관 디지털자산 시장의 인프라 표준을 만들어가고 있는 기업이 바로 웨이브릿지입니다.

2025년 웨이브릿지 프라임을 출시하고, 2026년 글로벌 확장을 가속하고 있는 웨이브릿지는 VASP 신고 수리와 ISMS 인증을 확보했으며, 솔라나 재단과 스테이블코인 인프라 개발 협업을 추진하는 등 글로벌 프라임브로커로서 입지를 확대하고 있습니다. 이들에게 시스템 안정성은 곧 고객 자산의 안전과 직결됩니다.

소규모 인력으로 복잡한 글로벌 MSA 환경을 운영하며 겪은 과제부터, 와탭(WhaTap) 도입을 통해 고객 신뢰를 구축하기까지의 여정을 오종운 CTO와 장원엽 DevOps 엔지니어의 인터뷰를 통해 살펴봅니다.

인터뷰 참가자

  • 오종운 님 | 웨이브릿지 CTO - 삼성SDS·케이뱅크 등 약 20년간의 금융 IT 경력. 현재 기술 전략 수립 및 멀티 리전 인프라 설계 총괄
  • 장원엽 님 | 웨이브릿지 DevOps 엔지니어 - AWS 인프라 운영, CI/CD 파이프라인 관리, 와탭 기반 전사 모니터링 체계 담당

회사 소개

Q. 웨이브릿지에 대해 소개해주시겠어요?

오종운: 웨이브릿지는 법인 및 기관투자자가 디지털자산을 안전하게 거래하고 보관할 수 있도록, 수탁(Custody), 중개(Brokerage), 결제 및 리포팅을 포함한 디지털자산 프라임 브로커리지 서비스를 제공하는 인프라 기업입니다.

웨이브릿지는 가상자산사업자(VASP) 신고 수리를 완료하고 ISMS 정보보호관리체계 인증을 취득해, 금융 인프라로서 높은 수준의 보안성과 신뢰를 확보하고 있습니다. 주력 플랫폼인 웨이브릿지 프라임(Wavebridge Prime)을 통해 한국(Prime KR)은 물론 유럽(Prime EU)과 아시아 지역에 걸쳐 다양한 워크로드를 운영하며, 글로벌 비즈니스를 전개하고 있습니다.

도입 배경: 애플리케이션 가시성 부재가 초래한 장애 대응 지연과 DevOps 리소스 부담

Q. 와탭 도입 전 시스템 모니터링 환경은 어떠셨나요?

오종운: 기관 고객을 대상으로 하는 서비스 특성상 장애 대응 속도는 곧 고객 신뢰와 직결되는데요. 도입 전에는 AWS CloudWatch와 OpenSearch를 함께 사용했지만, 가장 큰 문제는 애플리케이션 레벨 가시성이 부족하다는 점이었습니다. API 응답 지연이 발생해도 CPU나 메모리 같은 인프라 지표만 확인될 뿐, 어떤 트랜잭션이나 SQL 쿼리가 병목인지 파악할 수 없었습니다.

장원엽: 맞습니다. 원인 파악을 위해 CloudWatch 메트릭을 확인하고 → OpenSearch에서 로그를 검색한 뒤 → RDS 성능 도구를 다시 확인하는 등 여러 콘솔을 오가야 했습니다. 장애 인지부터 원인 파악까지 30분에서 1시간 이상 걸리는 경우가 많았습니다. 또한 다수의 워크로드 계정과 수백 개의 컨테이너·서버를 운영하는 환경에서 CloudWatch 알람을 동적으로 수동 관리해야 했기 때문에 사실상 운영이 어려운 수준이었습니다.

(좌) 웨이브릿지 장원엽 DevOps 엔지니어, (우) 웨이브릿지 오종운 CTO

Q. 그 외에도 운영 과정에서 겪으셨던 어려움이 있었나요?

장원엽: ISMS 보안 규정으로 외부 원격 접근이 제한되어, 야간이나 주말 장애 발생 시 직접 출근해야 하는 부담도 컸습니다. OpenTelemetry와 Jaeger 기반의 분산 추적도 시도했지만 구축과 운영의 복잡성으로 포기했고, 프론트엔드 영역은 모니터링이 더욱 어려웠습니다.

결국, DevOps 팀이 모니터링 환경 구축과 알람 설정에만 일주일씩 매달리는 상황이 반복되었고, 정작 인프라 개선이나 자동화 같은 본질적인 업무에 손을 대는 데 큰 한계가 있었습니다.

Q. 수많은 글로벌 모니터링 솔루션 중 와탭을 선택하신 결정적인 이유는 무엇이었나요?

오종운: 첫째, 인프라부터 마이크로서비스, 데이터베이스, 프론트엔드까지 단일 플랫폼에서 풀스택 모니터링이 가능하다는 점입니다.

둘째는 비용 효율성입니다. D사 등 글로벌 솔루션도 검토했지만, 다수의 계정과 서비스를 운영하는 환경에서는 비용이 2~3배 이상 증가하는 구조였습니다. 반면 와탭은 스타트업 지원 프로그램을 통해 합리적인 비용으로 동일 수준의 커버리지를 제공했습니다.

장원엽: 실무자 입장에서는 SaaS라는 점이 가장 큰 장점이었습니다. DevOps 인력이 제한된 상황에서 별도의 모니터링 서버를 구축·운영할 필요 없이 에이전트 설치만으로 즉시 활용할 수 있어 도입 부담이 낮았습니다.

또한 Java, Kotlin, Python과 ECS Fargate, EKS 등 혼합 환경을 모두 지원하는 점도 적합했고, 한국 시간대 기술 지원과 온사이트 교육까지 제공된 점은 외산 솔루션과 확실히 차별화된 경험이었습니다.

※ 와탭(WhaTap)은 SaaS와 On-premise 환경을 모두 지원합니다.

문제 해결: 하나의 플랫폼으로 가시성, 장애대응 체계, 프론트엔드 과제 해결

Q. 와탭 도입 후 직면했던 기술적 과제들을 어떻게 해결하셨나요?

장원엽: 앞서 겪었던 문제들은 와탭의 기능들을 통해 대부분 해결되었습니다. 가장 먼저, 애플리케이션 가시성 부족 문제는 '히트맵'과 '트랜잭션 프로파일링'으로 해결했습니다. 이제는 배포 직후 성능 저하 구간을 히트맵에서 클릭 한 번으로 확인할 수 있고, 메서드 실행 시간, SQL 쿼리, 외부 HTTP 호출까지 한 화면에서 드릴다운 형태로 직관적으로 파악할 수 있습니다.

와탭 APM 대시보드의 히트맵 기반 트랜잭션 드릴다운 분석 화면(트랜잭션별 응답 시간, SQL 건수, HTTP 요청 경로 등의 지표를 한 화면에서 확인 가능)
와탭 APM 대시보드의 히트맵 기반 트랜잭션 드릴다운 분석 화면 - 트랜잭션별 응답 시간, SQL 건수, HTTP 요청 경로 등의 지표를 한 화면에서 확인 가능

또한 기존에 어려움을 겪었던 마이크로서비스 호출 추적 역시 와탭의 '멀티 트랜잭션 분석'을 통해 전체 호출 경로와 병목 구간을 한눈에 식별할 수 있게 되었습니다.

와탭 멀티 트랜잭션 분석 화면(단일 요청에서 파생된 하위 트랜잭션의 호출 흐름과 구간별 응답 시간을 한눈에 확인 가능)
와탭 멀티 트랜잭션 분석 화면 - 단일 요청에서 파생된 하위 트랜잭션의 호출 흐름과 구간별 응답 시간을 한눈에 확인 가능

특히 ISMS 환경에서 큰 효과를 보았습니다. 와탭은 SaaS 기반이라 서버에 직접 접근하지 않고도 웹 브라우저만으로 1차 원인 파악이 가능해졌고, 야간·주말 출근 부담이 크게 줄었습니다. 현재는 사무실 모니터에 프론트엔드, 백엔드, DB 지표를 통합한 '플렉스 보드(Flex Board)'를 상시 띄워놓고 전체 서비스 상태를 점검하고 있습니다.

와탭 플렉스 보드 화면(APM, 쿠버네티스, DB, 서버 인프라 등의 지표를 하나의 대시보드에 통합 구성하여 전체 서비스 상태를 실시간 모니터링)
와탭 플렉스 보드 화면 - APM, 쿠버네티스, DB, 서버 인프라 등의 지표를 하나의 대시보드에 통합 구성하여 전체 서비스 상태를 실시간 모니터링

Q. 금융권 수준의 보안 환경에서 SaaS 형태로 도입하는 데 규제나 컴플라이언스 측면의 제약은 없었나요?

오종운: 금융권에서 클라우드나 SaaS 솔루션을 도입할 때는 일반적으로 CSP(클라우드 서비스 제공자) 안정성 평가 등 까다로운 절차를 거쳐야 하는 것이 맞습니다. 다만 당시 저희는 해당 평가를 필수적으로 받아야 하는 의무 대상은 아니었기 때문에 컴플라이언스나 보안 규제로 인한 큰 제약 없이 비교적 수월하게 도입을 진행할 수 있었습니다.

장원엽: 실무 운영 관점에서는 오히려 SaaS라는 점이 저희 보안 환경에서 장점으로 작용했습니다. ISMS 규정상 외부에서 AWS 콘솔이나 서버에 직접 접근할 수 없었는데, 와탭은 웹 브라우저만으로 대시보드에 접속해 모니터링 현황을 확인할 수 있어 보안 규정을 준수하면서도 원격 대응이 가능해졌습니다.

Q. 처음에는 백엔드 중심으로 도입하셨다가, 이후 프론트엔드까지 확장하신 계기가 있었나요?

장원엽: 초기에는 백엔드 APM 중심으로 도입을 계획했고, 프론트엔드 모니터링은 고려하지 않았습니다. 하지만 서비스를 운영하다 보니, 사용자가 페이지 지연이나 에러를 제기했을 때 서버 데이터만으로는 원인을 명확히 설명하기 어려웠습니다. 로그나 기록이 부족해 고객 상황을 일일이 확인하고 재현 시나리오를 만들어 테스트해야 했고, 이 과정에서 많은 시간이 소요되었습니다.

별도 프론트엔드 솔루션을 검토했지만 도구가 분산되면 관리 일관성이 떨어질 우려가 있었고, 결국 와탭의 프론트엔드 모니터링으로 확장했습니다. 현재는 와탭 브라우저 모니터링의 AJAX 히트맵을 통해 사용자 환경에서 발생하는 API 지연과 에러를 실시간으로 파악하고 있습니다.

(AJAX 히트맵, 페이지 로드 타임라인, 에러 건수, 사용자 세션 등 프론트엔드 성능 지표를 실시간 추적)
와탭 브라우저 모니터링 대시보드 - AJAX 히트맵, 페이지 로드 타임라인, 에러 건수, 사용자 세션 등 프론트엔드 성능 지표를 실시간 추적

핵심 성과: 선제적 장애 대응체계 구축과 데이터 기반 조직 문화로의 전환

Q. 모니터링 고도화가 실제 비즈니스 안정성에 기여한 대표적인 사례가 있다면 소개 부탁드립니다.

오종운: 2025년 11월 클라우드플레어(Cloudflare) 글로벌 접속 장애가 대표적입니다. APM 지표상으로는 정상 응답으로 보였지만, 와탭의 'URL 모니터링'에서 즉각 오류 알람이 발생해 선제적으로 인지할 수 있었습니다. 덕분에 고객 클레임 전에 금융 당국 보고와 고객 공지를 신속하게 수행할 수 있었습니다.

와탭 URL 모니터링 대시보드
와탭 URL 모니터링 대시보드

장원엽: 이 외에도 와탭을 통해 잠재적인 문제를 사전에 발견한 사례가 있습니다. 도입 전에는 서버가 간헐적으로 재시작되는 현상이 반복되어도 원인을 파악하지 못했는데, 와탭의JVM 힙 메모리 모니터링을 통해 시간이 지날수록 메모리가 누적되고 GC가 과도하게 발생하는 패턴을 명확히 확인할 수 있었습니다. 이를 기반으로 선제적인 튜닝을 진행해 시스템을 안정화했습니다.

Q. 와탭 도입 이후 얻은 정량적·정성적 성과를 종합해 주신다면요?

장원엽: 정량적으로는 장애 원인 파악 시간이 기존 30분~1시간에서 5~10분 이내로 크게 단축되었습니다. 또한 기존에는 단순 메트릭 중심이었던 모니터링이, 현재는 APM, 서버, DB, 브라우저, URL 등 약 100개 이상의 에이전트가 운영되는 풀스택 환경으로 확장되었습니다. 이와 함께 서버 디스크 용량 초과나 AWS 인프라 이슈로 인한 EC2 예기치 않은 재부팅도 사전 알림을 통해 대응 가능해졌고, 치명적인 서비스 장애를 예방할 수 있었습니다.

정성적으로는 조직 문화와 협업 방식의 변화가 가장 큽니다. 과거에는 수동 알람 설정에 많은 시간을 소모했다면, 현재는 모니터링을 와탭에 위임하고 확보된 리소스를 IaC 전환이나 개발 환경 개선 등 본질적인 기술 고도화에 집중하고 있습니다. 또한 개발팀과 이슈를 논의할 때 와탭 화면을 기준으로 트랜잭션 단위로 소통하면서 와탭이 조직 내 ‘데이터 기반 커뮤니케이션의 공용어’로 자리 잡았습니다.

오종운: 궁극적으로는 글로벌 확장과 서비스 안정성에 대한 확신을 얻었습니다. 유럽(Prime EU)이나 아시아 리전으로 서비스를 확장할 때도, 와탭 에이전트 설치만으로 본사와 동일한 수준의 모니터링 체계를 즉시 적용할 수 있다는 점이 확인되었습니다. “현재 시스템 상태를 정확히 이해하고 있다”는 데이터 기반의 확신은, 웨이브릿지가 디지털자산 시장에서 높은 수준의 안정성을 유지하고 고객 신뢰를 확보하는 데 있어 핵심적인 기반이 되고 있습니다.

향후 목표

Q. 성공적인 모니터링 구축 이후의 단계로, 향후 시스템 운영의 방향성과 와탭에 기대하는 바는 무엇인가요?

오종운: 장기적으로는 와탭의 모니터링 데이터를 기반으로 장애 징후를 사전에 예측하고, 자동으로 대응하는 선제적 운영 체계를 구축하는 것이 목표입니다. 글로벌 서비스 확장에 맞춰 모니터링 표준화 체계도 더욱 공고히 할 계획입니다.

또한 와탭이 준비 중인 AI 기반 이상 패턴 탐지 기능을 통해 운영 효율을 한 단계 더 끌어올릴 수 있기를 기대하고 있습니다. 최근 사내 개발과 업무 전반에 LLM 활용이 확대되면서 GPU 자원과 토큰 사용량을 효율적으로 관리하는 것도 중요한 과제가 된 만큼, 이 영역에서도 와탭과 지속적으로 시너지를 만들어가고자 합니다.

※ 참고할 만한 글: AI 네이티브 옵저버빌리티, 와탭은 어떻게 준비하고 있는가?

장원엽: 와탭 Open API의 쓰기 기능이 확장되어 CI/CD 배포 시 모니터링을 코드로 관리(IaC)할 수 있게 되기를 기대합니다. 궁극적으로는 와탭 알림을 트리거로 인프라 자동 복구까지 연동해, 무중단에 가까운 시스템 운영 환경을 만드는 것이 목표입니다.

마치며

웨이브릿지는 와탭 도입을 통해 장애 원인 파악 시간을 기존 30분~1시간에서 5~10분 이내로 단축하고, 100개 이상의 에이전트가 운영되는 풀스택 모니터링 체계를 구축했습니다. ISMS 규제로 외부 접근이 제한된 환경에서도 SaaS 기반 실시간 모니터링으로 운영 대응력을 확보했으며, 유럽과 아시아 리전 확장에도 동일한 수준의 모니터링 품질을 적용할 수 있는 기반을 마련했습니다.

이는 단순한 도구 도입을 넘어, 조직 전반에 데이터 기반 의사소통 문화를 정착시킨 사례입니다. 디지털자산, 핀테크, 금융 서비스처럼 시스템 안정성이 곧 비즈니스 신뢰로 이어지는 산업에서, 와탭이 어떤 가치를 제공할 수 있는지를 명확히 보여줍니다. 금융·핀테크·플랫폼과 같이 장애 리스크가 곧 비즈니스 리스크로 직결되는 기업이라면, 와탭과 같은 통합 모니터링 전략을 적극적으로 검토해볼 필요가 있습니다.

웨이브릿지처럼 분산된 모니터링을 하나의 풀스택 관제로, 그리고 글로벌 서비스 안정성까지 고려하고 있다면? 👉도입 문의하기

최고의 기업들이 선택한 옵저버빌리티 플랫폼 와탭,
지금 바로 경험해보세요