뉴스레터
2025-10-30
리테일·이커머스 운영팀이 "블랙 프라이데이 기간"에도 침착할 수 있는 이유
리테일·이커머스 운영팀이 "블랙 프라이데이 기간"에도 침착할 수 있는 이유

안녕하세요! AI 네이티브 옵저버빌리티 플랫폼, 와탭랩스입니다.

타임세일, 할로윈 프로모션, 블랙프라이데이 세일 등 최근 리테일·이커머스 업계에서는 시즌별 이벤트가 연중 이어지고 있습니다. 이에 따라 소비자들도 때를 기다렸다가 한꺼번에 특정 프로모션에 몰리는 경향을 보이는데요. 문제는 이같은 단기간 트래픽 폭증이 예기치 못한 서비스 장애로 이어질 수 있다는 점입니다.

오아시스마켓에서 진행한 타임특가 이벤트 (출처: 오아시스)

한 조사에 따르면, 리테일·이커머스 기업의 약 40%가 고객에게 직접적인 영향을 미치는 장애를 경험하고 있으며, 평균적으로 한 달에 최대 76건의 장애가 발생하는 것으로 나타났습니다. 이로 인한 손실 규모는 월 최대 100만 달러(약 13억 원)에 달합니다. 특히, 대형 이커머스 기업은 1분의 다운타임만으로 평균 약 9,000달러(약 1,200만 원)의 손실을 겪는다고 합니다. 이러한 손실을 최소화하기 위해 많은 기업들이 실시간 모니터링을 도입해 서비스 이상 징후를 조기에 감지하고, 즉각 대응할 수 있는 체계를 구축하고 있습니다.

오늘 소개할 오아시스(OASIS)에스티컴(STCOMM) 역시, 이벤트 시즌마다 폭증하는 트래픽 속에서도 안정적인 서비스 운영을 위해 최전선에서 노력하는 대표적인 기업입니다. 오아시스는 밤 11시까지 주문하면 다음 날 오전 7시 이전에 도착하는 주 7일 새벽배송 서비스를 제공하고 있으며, 에스티컴은 노스페이스, 반스, 팀버랜드 등 글로벌 브랜드의 웹·앱 서비스를 운영하며 커머스 인프라를 책임지고 있습니다.

이 두 기업의 공통점은 서비스 안정성을 확보하기 위해 와탭(WhaTap)을 사용하고 있다는 점인데요. 이번 레터에서는 각종 이벤트로 트래픽이 급증하는 환경 속에서도 두 기업이 어떻게 효율적인 IT 운영을 실현하고 있는지를 살펴보려 합니다. 먼저, 오아시스마켓의 운영과 개발을 총괄하고 있는 이정섭 부장님을 비롯한 운영, 개발 담당자 5분의 이야기를 들어보겠습니다.

밤 11시 새벽배송 마감 직전 폭하는 트래픽, 오아시스는 어떻게 안정적인 서비스를 유지할까?

“(와탭을 도입하고 나서) 서비스 안정성이 확보되니까, 새 프로젝트나 서비스 개발에 쓸 리소스를 확보할 수 있었어요. 그 덕분에 조직 전체의 업무 여력도 훨씬 넓어졌고요. 결국 정리하자면 '안정성 확보 → 고객 신뢰 향상 → 성장 추진' 이러한 선순환 구조가 만들어진 거죠.”

- 이정섭, 오아시스마켓 운영/개발 책임

신선식품 유통의 중심 ‘오아시스마켓’ (이미지 출처: 오아시스)

안녕하세요! 이정섭 부장님, 대표로 소개 부탁드립니다.

이정섭: 안녕하세요. 저는 오아시스마켓에서 운영과 개발을 총괄하고 있는 이정섭입니다. 시스템이 안정적으로 돌아갈 수 있도록 시스템 운영은 물론, 프론트엔드와 서버 개발까지 전반적인 업무를 맡고 있습니다.

저희 오아시스마켓은 온라인과 오프라인을 아우르며 친환경, 유기농 신선식품을 주로 판매하고 있는데요. 현재 온라인 회원은 약 200만 명을 보유하고 있으며, 전국적으로 60곳의 오프라인 매장을 운영하고 있습니다. 온라인과 오프라인을 동시에 운영하다 보니 재고 관리와 상품 신선도 유지가 중요한데, 이를 효율적으로 관리하는 데 힘을 쏟고 있습니다.

와탭 도입하기 전에는 운영이나 기술적인 부분에서 어떤 어려움이 가장 컸나요?

이정섭: 특정 시간대만 되면 데이터베이스나 이미지 서버에 트래픽이 몰려서 장애가 자주 발생했어요. 그때마다 고객 불만이 쏟아졌고요. 원인을 찾으려면 로그를 추가하거나 인스턴스, CPU, 메모리 같은 리소스를 증설해야 했는데, 시간도 오래 걸리고 비용도 많이 들어서 운영 효율성이 떨어질 수밖에 없었습니다.

전영남(서버 인프라 구축/운영, 백엔드 개발, 매장 인사시스템 개발·유지보수 담당): (고개 끄덕이며) 맞습니다. 이런 상황이 계속 반복되니까 저희 팀은 매일 밤 '오늘은 또 무슨 장애가 날까?' 하는 불안 속에서 근무했어요. 문제는, 막상 장애가 터지면 정확한 원인을 찾기 힘들어서 추측에 의존해 대응하는 경우가 많았다는 겁니다.

이정섭: 네, 추측에 의존하다 보니 개발이든 운영이든 인력이 전부 다 투입될 수밖에 없었죠.

전영남: 맞아요. 거기에다 문제 해결 과정에서 부서 간 커뮤니케이션 시간도 필요하다 보니 대응이 늦어지고, 결국 고객 불만매출 손실 위험으로 이어졌습니다. 특히 새벽배송 마감 직전 주문이 몰릴 때는 장애가 잦았는데, 원인을 모르니 사실상 ‘운에 맡기는’ 식으로 대응할 수밖에 없었습니다.

정말 새벽배송 마감 때면 트래픽이 엄청 몰렸겠는데요.

윤현중(오아시스 쇼핑몰 프론트, 백엔드 개발): 네 맞아요. 새벽배송 마감 시간대인 밤 11시 전후에는 트래픽이 폭주해서 주문이 지연되거나 아예 막히는 경우도 많았습니다. 사용자가 급격히 늘면서 슬로우 쿼리나 비효율적인 로직이 서버에 바로 영향을 줬고, 이게 결국 서비스 장애로 이어졌습니다.

이정섭: 당연히 고객 불만도 커질 수 밖에 없었고요.

윤현중: 네, 더 큰 문제는 실시간 알림 체계가 없었다는 점이었는데요. 그래서 퇴근 후에도 서버를 수시로 들여다봐야 했고, 팀 피로도는 쌓이고 업무 효율성도 크게 떨어졌습니다.

와탭을 쓰고 난 후 어떤 점들이 달라졌고, 성과는 어떻게 나타났나요?

이정섭: 와탭을 쓰고 나니까 제일 먼저 느낀 게, 문제를 미리 잡을 수 있게 됐다는 거예요. 히트맵에서 이상 징후가 보이면 바로 쿼리 튜닝이나 인덱스 추가, 로직 개선 같은 걸 선제적으로 할 수 있었죠. 그러다 보니 자연스럽게 CDN 서버 분리나 캐시 서버(Redis) 도입, 세션 클러스터링 같은 구조적인 개선까지 이어졌고, 그 결과 서비스 장애가 거의 사라졌습니다.

전영남: 맞아요, 장애 자체가 확 줄었죠. 특히 트랜잭션 스피드, 히트맵, TPS 등을 종합 모니터링하면서 대응 방식이 완전히 바뀌었어요. 장애 건수도 절반 이상 줄고, 평균 대응 시간은 거의 반으로 단축됐습니다.

느린 트랜잭션을 선별해 지연 구간을 한눈에 파악 가능한 히트맵의 트레이스 분석 화면

다른 분들도 와탭을 사용하면서 효과를 많이 체감하셨나요?

김찬규(백엔드 개발 및 풀필먼트 시스템 관리): 네, 저는 특히 이벤트 시즌에 효과를 많이 봤다고 말할 수 있을 것 같아요. 예전엔 장애를 고객에게 제보 받고 알았는데, 지금은 APM의 액티브 스테이터스의 SQL 수치가 늘어나는 걸 보면 DB 쿼리 응답이 지연되고 있다는 걸 바로 확인하고, 슬로우 쿼리를 빠르게 잡아낼 수 있습니다. 이건 고객 경험과도 직결되고, 매출 안정성에도 큰 도움이 되었죠. 솔직히 말해 서비스 안정성이 최소 200%는 좋아졌다고 생각합니다.

윤현중: (웃으며) 200%라는 표현이 과장이 아닌 게, 서비스가 안정되면서 업무 방식 자체가 달라졌거든요. 예전에는 로그부터 전부 뒤져야 했는데, 지금은 와탭에서 먼저 이상 징후를 보고 로그로 확인하는 순서로 바뀌었습니다. Apdex 지표나 히트맵에서 평소와 다른 패턴이 보이면 서비스를 점검하고, 알림 시스템 덕분에 빠르게 감지하여 대응도 가능합니다.

이동현(오아시스 서버 개발): 저는 심리적으로 안정감이 생겼다는 게 제일 큰 것 같아요. 예전에는 고객 제보 기다리면서 허둥대는 경우가 많았는데, 지금은 히트맵이랑 서버 로그로 바로 원인을 찾아 대응할 수 있잖아요. “문제가 생겨도 바로 확인하고 조치할 수 있다”는 확신이 생긴 거죠.

대시보드 화면에서 바로 확인이 가능한 Apdex, TPS 지표

이러한 성과들이 비즈니스 측면에서 어떤 긍정적인 영향을 주었나요?

이정섭: 가장 큰 변화는 서비스 안정화로 인해 고객 신뢰가 높아졌다는 점이에요. 또한, 안정성이 확보되니까 신규 프로젝트나 서비스 개발에 필요한 리소스를 확보할 수 있었고, 조직 전체적으로 업무 여력이 훨씬 넓어졌습니다.

전영남: (맞장구치며) 네, 그게 정말 큽니다. 장애 대응이 빨라지면서 고객 불편이 확 줄었고, 내부적으로도 매번 긴급 대응에 매달리던 상황이 줄었어요. 그 덕분에 말씀하신 것처럼 신규 프로젝트나 서비스 개선에 쓸 수 있는 시간과 에너지가 생겼습니다. 결과적으로 고객 경험은 더 좋아지고, 내부 효율성도 올라간 거죠.

강지현(오아시스 앱 개발 및 유지보수 담당): 저희 개발팀도 그 효과를 확실히 느끼고 있습니다. 시스템이 안정되니까 새 프로젝트를 훨씬 적극적으로 추진할 수 있었거든요. 실제로 아임닭, 테라로사, 티몬 같은 신규 프로젝트에도 와탭을 적용하면서 안정적인 서비스를 제공할 수 있었습니다.

이정섭: 결국 정리하면 “안정성 확보 → 고객 신뢰 향상 → 성장 추진” 이렇게 선순환 구조가 만들어진거라고 할 수 있겠네요.

안정성 확보를 기반으로 2025년 상반기 최대 매출을 경신한 오아시스 사례 전문을 지금 확인해보세요. 오아시스 사례 전문 보기 →

다음으로는 노스페이스, 반스, 팀버랜드 등 주요 이커머스 플랫폼의 구축과 운영을 전문으로 하는 기업, 에스티컴(STCOMM)의 정광조 부장님을 만나봤습니다. 정 부장님은 에스티컴에서 인프라 파트를 총괄하고 있으며, 와탭과는 5년 이상 함께하며 누구보다 와탭을 깊이 있게 이해하고 활용하고 계신 분입니다. 이번 인터뷰에서 와탭을 통해 실제 IT 운영 환경을 어떻게 개선했는지, 현장의 이야기를 직접 들어보겠습니다.

에스티컴, WhaTap과 함께한 5년의 성과로 이커머스 운영 모니터링 체계 완성

“솔직히 도입 당시 오픈소스 툴을 활용해 내부적으로 직접 모니터링 시스템을 구축해볼까 하고 테스트를 진행한 적도 있었는데요. UI나 데이터 시각화 측면에서 와탭(WhaTap)만큼 만족스럽지 않았습니다. 특히, 와탭의 히트맵이 직관적인 점이 좋고, 지금도 잘 보며 활용하고 있습니다.” - 정광조, 에스티컴 IT 인프라 파트 총괄

안녕하세요 정광조 부장님, 소개 한번 부탁드립니다.

에스티컴에서 인프라와 DevOps 업무를 맡고 있는 정광조입니다. 에스티컴에 합류한 지 5년쯤 되었고, 지금까지 전반적인 인프라 운영을 책임지고 있습니다. 제가 처음 합류했을 때만 해도 인프라 조직이 없고, IT 운영도 외주에 의존하고 있는 상황이었는데요. 점차 시스템을 직접 저희가 관리하기 시작하면서 자연스럽게 모니터링의 중요성도 커졌습니다.

그 과정에서 와탭을 도입하게 되었고, 지금까지 지속 활용하며 안정적인 서비스 운영에 큰 도움을 받고 있습니다. 현재 저희는 와탭의 APM, DPM, SMS, URL 모니터링을 사용하고 있습니다.

에스티컴은 어떤 비즈니스를 하는 회사인가요?

에스티컴은 이커머스 브랜드의 웹·모바일 플랫폼 운영부터 배송 시스템(WMS), 회원 관리(PRM), 클라우드 인프라까지 IT 운영 전반을 책임지고 있는 기업입니다. 노스페이스, 반스, 팀버랜드 등 주요 브랜드의 온라인 플랫폼을 운영하고 있으며, 최근에는 대기업 계열사의 AI센터와 신규 프로젝트도 시작했습니다. 브랜드 입장에서는 매출 성장에만 집중할 수 있도록 기술 기반의 운영은 저희 에스티컴이 통합적으로 관리하는 구조라고 보시면 될 것 같습니다.

노스페이스, 반스, 팀버랜드 등 커머스 브랜드 웹·앱 플랫폼 운영 담당하는 에스티컴

에스티컴에서 와탭을 사용하기 전 어떤 기술적 또는 운영상의 어려움이 있으셨나요?

와탭을 도입하기 전 저희팀이 직면한 가장 큰 어려움은 장애 발생 시 원인 파악이 늦어지고, 그로 인해 대응 시간이 길어지는 ‘구조적인 한계’였습니다. 애플리케이션과 인프라 모두에서 발생할 수 있는 이슈를 빠르게 인지하고 조치할 수 있는 그런 체계가 부족했어요. 자연스럽게 운영 부담은 커질 수밖에 없었죠.

특히, 트래픽이 집중 되는 이벤트 시점에는 이로 인해 발생하는 지연(delay)이 브랜드 신뢰도에 직결될 수 있는 리스크로 작용했습니다. 이같은 기술적 부채가 누적되었고, 운영 인력도 제한적인 상황이었습니다.

이커머스 플랫폼 특성상 동시 접속자 수, 트랜잭션 흐름, 리소스 사용량 등을 실시간으로 파악할 수 있는 구조가 필요했지만, 당시에는 이를 체계적으로 모니터링할 수 있는 툴이 없었습니다. 저희 인프라 담당자가 장애 발생 후 수동으로 로그를 탐색하고, 개별 서버를 직접 재기동하는 방식으로 대응을 했었어요. 지금 생각해보면 당시 많은 운영 부담으로 인해 모두가 힘들어 했던 기억이 있습니다.

운영적 부담과 구조적인 한계를 와탭으로 어떻게 해결하셨는지 궁금합니다

와탭을 사용하고 나서부터 본격적으로 운영 효율화를 추진할 수 있었습니다. 가장 먼저, 실시간 알림 기능을 Slack과 연동하여 이슈 발생 시 자동으로 알림이 전달되도록 구성했어요. 여기에 Webhook을 활용하여 Slackbot 연계 자동화 시스템도 구축했습니다. 현재는 와탭에서의 알림을 Slack으로 넘기면, Slackbot이 이를 인지해 AWS에 명령을 내려주는 방식으로 운영되고 있습니다.

와탭과 Slack을 연동하여 AWS에 명령을 내리는 방식 구축

과거에는 스레드 포화와 같은 이슈가 발생했을 때 직접 서버에 접속해 수동으로 조치해야 했는데요. 지금은 설정한 조건이 충족되면 시스템이 자동으로 서버를 재기동하고, Slack을 통해 조치 결과까지 확인할 수 있는 구조가 마련이 된거죠. 덕분에 반복적인 수작업을 줄이고 운영 부담을 크게 낮추었습니다.

또한, 단순히 ‘빠르게 알림을 받는다’는 수준에 그치지 않고, 와탭을 활용해 인프라 및 애플리케이션을 정량적으로 개선하고 있어요. 예를 들어, 이벤트 기간에 동접자가 급증할 경우 이를 실시간으로 모니터링할 수 있고, 메모리 사용량이나 CPU 부하 추이를 기반으로 스케일링 시점을 예측하여 리소스를 탄력적으로 운영할 수 있게 되었죠. 덕분에 불필요한 오버 프로비저닝을 방지하면서 비용 절감 효과도 함께 얻고 있습니다.

저희 고객사에서 행사 시즌이면 서버 상태나 트래픽 추이에 대한 요청이 자주 들어오는데요. 와탭 대시보드에서 실시간 CPU, 메모리, 동접자 수 데이터를 바로 추출해 전달드리곤 합니다. 그렇게 전달드리면 고객사에서도 만족해 하시는 것 같아요.

와탭 대시보드에서 확인 가능한 CPU, 메모리, 동시접속 사용자 수 데이터

와탭을 사용하고 나서 정성적인 측면에서도 내부 개발자들의 데이터 인식 수준이 높아졌다고 말할 수 있을 것 같아요. 단순 알림을 넘어서, 트랜잭션 기반으로 애플리케이션 개선 포인트를 직접 찾아내고 있는데요. 개발자 모두 와탭 교육에도 적극적으로 참여하고 있고, 최근에는 메소드 단위 모니터링도 계획하고 있습니다. 앞으로는 더 세분화된 모니터링 체계를 구축해 운영 효율성과 서비스 품질을 함께 끌어올릴 수 있도록 준비할 계획입니다.

문제 해결의 과정에서 와탭의 어떤 기능이 도움이 되었고, 자주 활용하고 계신가요?

와탭의 경고/알림 기능뿐만 아니라 히트맵트랜잭션 통계 기능을 자주 활용하고 있습니다. 문제가 발생했을 때 즉시 인지할 수 있고, 통계 데이터를 기반으로 에러가 자주 발생하는 구간을 추적해 원인을 빠르게 파악할 수 있죠. 위에서도 언급했지만 실시간 동접자 수는 고객사 브랜드의 요청으로 자주 제공하게 되는데, 이 데이터가 스케일링 판단에도 도움이 됩니다.

솔직히 도입 당시 오픈소스 툴을 활용해 내부적으로 직접 모니터링 시스템을 구축해볼까 하고 테스트를 진행한 적도 있었는데요. UI데이터 시각화 측면에서 와탭만큼 만족스럽지 않았습니다. 특히, 와탭 히트맵이 직관적인 점이 좋고, 지금도 잘 보며 활용하고 있습니다.

에스티컴 사무실에 띄워 놓은 와탭 대시보드 화면

실시간 모니터링부터 자동화, 분석, 개선까지 운영 전 과정을 체계적으로 구축한 에스티컴 사례 전문을 지금 확인해보세요. 에스티컴 사례 전문 보기 →

오늘은 리테일·이커머스 업계 현장 이야기를 통해 와탭이 서비스 운영 안정화와 효율성 측면에서 어떤 가치를 제공하고 있는지 살펴봤습니다. 인터뷰를 통해 확인할 수 있었던 것은, ‘운영’이 단순히 서비스의 안정성을 유지하는 활동에 그치지 않고, 비즈니스 성장을 뒷받침하는 견고한 기반이 된다는 점이었습니다.

디지털이 거의 모든 아날로그를 대체하는 오늘날, 기업의 목표는 고객에게 심리스(seamless)한 서비스 경험을 제공하는 데 있습니다. 이를 달성하기 위해서는 시스템 전반의 안정성과 효율성이 필수적이며, 와탭은 그 여정에서 신뢰할 수 있는 조력자 역할을 수행하고 있습니다. 지속 가능한 성장을 위해 안정적이고 효율적인 IT 서비스 운영 기반을 구축하고자 한다면, 지금이 와탭을 검토해 볼 시점이 아닐까요?

와탭 도입 문의하기 →

이번 10월 호 내용에서 궁금하신 점이 있거나 레터에 대한 피드백은 언제든 아래 링크를 통해 남겨주세요. 와탭 레터는 최신 IT 운영 트렌드는 물론, 현장에서 발견한 의미 있는 인사이트를 공유해 드립니다. 감사합니다.

10월 호 피드백 남기기 →

와탭 모니터링을 무료로 체험해보세요!