
KB헬스케어는 KB손해보험의 자회사로 2021년에 설립된 디지털 헬스케어 플랫폼입니다. 2022년 2월 헬스케어 서비스 플랫폼 오케어(O'CARE) 를 출시했고, 사용자 건강 데이터를 기반으로 한 조언·목표 관리와 맞춤 콘텐츠 추천 기능을 제공합니다. 현재 오케어는 KB금융 임직원을 대상으로 B2B 서비스를 운영 중이며, 응답자 중 87.1%가 일주일에 한 번 이상 서비스를 사용할 만큼 활성 사용률이 높습니다.
금융 계열사의 특성상 KB헬스케어는 서비스 데이터를 해외로 내보낼 수 없는 컴플라이언스 제약을 안고 있습니다. 그럼에도 1년도 안 되는 사이에 서비스를 안정적으로 궤도에 올릴 수 있었던 배경에는 와탭의 도움이 컸습니다. 프라이빗 클라우드 환경에서 서비스를 운영하는 IT 담당자라면 특히 눈여겨볼 만한 사례입니다. IT혁신본부 플랫폼팀 손병창 팀장을 만나 와탭으로 오케어를 어떻게 모니터링하고 있는지 들어봤습니다.
KB손해보험의 디지털 헬스케어 자회사. 서버실이 없는 올(All)-클라우드 환경에서 클라우드 운영과 빅데이터 업무를 담당하고 있다.
KB헬스케어는 KB손해보험의 자회사입니다. 헬스케어 서비스 플랫폼인 오케어(O'CARE)는 현재 KB금융 임직원을 대상으로 서비스를 제공하고 있고, 향후 서비스 범위가 확대되면 B2B·B2C 서비스도 계획하고 있습니다.
저희는 올 클라우드로 구성되어 있어요. 서버실도 없고 온프레미스 장비도 없는 올-클라우드 환경입니다. 팀에서 저는 클라우드 운영 업무와 빅데이터 업무를 맡고 있습니다.

Microsoft Azure 기반 올-클라우드. 애플리케이션·DB 모니터링은 와탭, IoT 디바이스 지표 수집은 Splunk로 이원화했다.
현재 마이크로소프트의 Azure 클라우드를 사용 중입니다. 2023년 초부터는 메디컬 플랫폼 서비스도 준비하고 있는데, 이 서비스는 AWS에서 구축하고 있어요. 온프레미스 장비 없이 올-클라우드 환경에서 VM·스토리지·보안 솔루션을 운영하고 있고, Apache·JBoss 같은 미들웨어 솔루션과 RDB·Document DB·NoSQL DB 등으로 인프라가 구성되어 있습니다. 애플리케이션과 데이터베이스 모니터링은 와탭(WhaTap), IoT 디바이스 지표 수집은 Splunk를 사용합니다.
저희 본부는 클라우드 엔지니어와 빅데이터 엔지니어로 구성되어 있고, 외부 MSP 파트너 인력이 함께 투입돼 업무를 보고 있습니다.
국내 리전 제공, 프라이빗 클라우드 설치 지원, 실시간 기술 지원. 이 3가지가 결정적이었다.
2022년 2월 오케어 맞춤형 건강관리 플랫폼을 런칭한 뒤, 서비스를 운영하다 보니 동시 접속자가 몰리는 이벤트 상황이나 애플리케이션 오류, 성능 이슈에 대한 대응이 필요해졌습니다.
Azure 클라우드 플랫폼에서도 Application Insights, Azure Monitor 같은 솔루션이 제공되고, 저희가 Splunk로 헬스케어 IoT 디바이스의 메트릭과 이벤트를 수집해 모니터링하고 있었습니다. 그럼에도 불구하고 앞서 말씀드린 애플리케이션 레벨의 이슈를 해결하기가 쉽지 않더라고요. 그래서 APM 솔루션 도입을 고려하게 됐고, 외주 개발사로부터 와탭과 몇몇 외산 솔루션을 소개받아 비교했습니다.
외산 솔루션을 검토하면서 걸린 문제가 데이터가 저장되는 '리전' 이었습니다. 해외 모니터링 솔루션은 국내 리전을 제공하지 않더라고요. 그런데 와탭은 국내 리전도 제공할 뿐 아니라 프라이빗 클라우드 내에 설치도 가능해 최종 선택하게 됐습니다.
기술 지원도 모니터링을 선택하는 중요한 요소인데요. 소프트웨어 제조사 엔지니어가 직접 기술 지원을 해주고, 온라인 채팅으로 실시간 문의가 가능해서 운영 입장에서 매우 도움이 됩니다. 이벤트 기간 동안 성능 개선에도 많은 도움을 받았습니다.
💡 Tip. 와탭의 배포 옵션
와탭은 Public SaaS뿐 아니라 Private SaaS와 온프레미스 설치형으로도 제공된다. SaaS의 UI와 분석 기능은 그대로 사용하면서 수집 서버와 데이터 저장소는 고객 내부망에 둘 수 있어, KB헬스케어처럼 그룹사 정책상 외부 저장이 제한된 금융 계열사 환경에 적합하다. 또한 와탭은 ISO/IEC 27001·27017·27018·27701, CSAP(클라우드보안인증), KCSP, CSA STAR, GS 인증 1등급 등 국내외 보안·개인정보보호 인증을 보유하고 있어 금융권 컴플라이언스 요건에도 부합한다.
출시 초기 성능 튜닝 → 위험 수준 경고 알림 → 쿼리 상세 분석 → 초기 DB 설계 개선까지. 모니터링 포인트가 단계별로 진화했다.
우선 오케어 서비스를 처음 출시할 때 많은 성능 개선 작업을 진행했습니다. 요즘은 특정 이벤트나 이슈가 발생했을 때를 대비해 위험 수준의 알림만 수신하도록 경고 알림을 설정해 운영 피로도를 낮췄고요. 알림을 통해 오류가 있는 쿼리를 상세하게 분석할 수 있었습니다.
특히 와탭 애플리케이션 모니터링의 히트맵 패널을 보며 응답 시간이 늦은 트랜잭션을 드릴다운 방식으로 분석합니다. 와탭 APM 덕분에 서비스 애플리케이션의 가용성을 확보해 안정적인 서비스 운영을 할 수 있게 됐습니다.
또한 와탭 데이터베이스 모니터링으로 초기 DB 설계의 문제를 발견해 지금도 꾸준히 개선하고 있습니다.
💡 Tip. 와탭 히트맵은 이렇게 동작한다
히트맵은 X축을 트랜잭션 종료 시점, Y축을 응답 시간으로 해서 종료된 개별 트랜잭션을 분포도로 표현한 차트다. 정상적인 웹 애플리케이션이라면 응답이 수 초 이하 구간에 집중된다.
이상 구간을 드래그하면 해당 시점의 트랜잭션 목록과 SQL·HTTP 호출·메소드 레벨까지 드릴다운해 원인을 추적할 수 있다. 와탭 고유의 '액티브 스택' 기술 덕분에 번거로운 프로파일 설정 없이도 메소드 레벨 추적이 가능하다.

💡 Tip. DB 설계 문제는 어떻게 찾아낼까
와탭 데이터베이스 모니터링은 슬로우 쿼리 분석, Lock Tree(락 Holder와 Waiter의 관계를 트리 구조로 시각화), 세션 히스토리, Top 오브젝트 같은 기능을 제공한다. CPU·메모리 같은 리소스 지표만 보는 것을 넘어 "어떤 쿼리가, 어떤 세션 때문에 느려졌는지"를 구조적으로 파악할 수 있어, 운영 중에 설계 단계의 문제까지 역추적할 수 있다.
서비스 출시 초기의 사용자 이탈을 막으려면 모니터링은 필수. 데이터를 내부망에 둬야 하는 환경이라면 와탭이 사실상 최적의 선택지다.
서비스 안정성을 위해 모니터링은 꼭 필요하다고 생각합니다. 특히 서비스 출시 초기에는 저희가 겪었던 접속 지연, 코드 에러 같은 성능 문제를 적시에 해결하지 못하면 사용자가 이탈합니다. 와탭 모니터링으로 특정 이벤트가 발생했을 때 바로 확인하도록 설정할 수 있었습니다.
와탭을 사용하면서 자연스럽게 오류를 발견하는 시간이 줄었고, 서비스 안정성에 집중할 수 있게 됐습니다. 저희 KB헬스케어 사무실에서는 큰 모니터로 와탭 대시보드를 상시 띄워 놓고 개발자들과 솔루션 담당자들도 모두 보고 있습니다.
저희처럼 회사 정책상 데이터를 내부망에 저장해야 하는 곳이라면, 클라우드 네이티브 모니터링이면서 내부망 설치도 가능한 와탭이 최적의 선택이 아닐까 싶습니다. 거기에 실시간 문의가 가능하고, 외산 솔루션과 비교해 비용이 합리적이라는 점 역시 와탭의 강점입니다.