#7 MongoDB Deep Dive - 몽고DB 분석

몽고DB(NASDAQ:MDB)는 뭐 하는 회사인지, 왜 이렇게 높게 평가 받는지 알아보자

Nov 15, 2023

Contents

몽고DB의 시장 평가 몽고DB 역사 데이터베이스란?몽고DB 아틀라스(프로덕트)비즈니스 모델 사용 사례: Albertsons (Digital Transformation)리스크 사항 주요 성장 드라이버 Conclusion

MongoDB(몽고DB)는 테크 쪽에서 일하는 사람이라면 한 번 쯤 들어봤을 만한 회사다. 주가는 연초 대비 100% 이상 성장했다. 시장의 기대를 한 몸으로 받고 있는 회사이다.

비전공자(경영학과)인 내가 봐도 이해하기 쉽게 MongoDB의 비즈니스 모델, 프로덕트, 리스크 사항 등을 시장 관점으로 알아보자.

몽고DB의 시장 평가

경영학도로서 먼저 프로덕트 분석을 들어가는 것보다 시장이 이 회사를 어떻게 평가하는가 등 빅픽처를 먼저 보는 것을 선호한다(주요 SaaS 지표 정리).

미국 내 상장 된 Enterprise SaaS 업체 중 몽고DB는 NTM(Next Twelve Months) 매출 멀티플 상 Snowflake 다음으로 2등으로 가장 높은 평가를 받고 있다.

왜 그럴까? 먼저 다른 80여개 SaaS 플레이어들의 평균과 몽고DB의 지표 비교를 해보자.

FCF: NTM FCF 멀티플도 133배 수준으로 매우 높은 편이다. 현금창출 능력이 좋다고 볼 수 없다.
Rev Growth: 매출 성장률도 전체 2등이 될 정도로 뛰어나다고 볼 수 없다. 특히, NTM 매출 성장률은 17%이고, 이는 평균수치인 15%를 겨우 우회하는 수준이다.
S&M: 세일즈/마케팅 비용이 매출의 50%나 차지한다. 이는 평균보다 21% 더 높은 수치이며 매우 경쟁이 높고 세일즈 사이클이 긴 특성을 가졌다고 볼 수 있다.
Net Expansion: 120%로 평균보다 높은 수치이지만 Snowflake(142%) 수준까진 아니다.
GM Adj. Payback: 13개월로 매우 훌륭한 과금 체계(Pricing Policy)를 갖고 있다.

지표만 놓고 봤을 때, 몽고DB는 S&M 투자가 많이 필요할 정도로 매우 치열한 경쟁이 펼쳐지는 시장에 있지만 한 번 고객을 온보딩할 경우, 빠르게 투자금을 회수할 수 있는 프로덕트라고 볼 수 있다. 하지만, 이 지표만 놓고 봤을 때, 상대적으로 몽고DB는 NTM 14.6배의 고평가를 받을 수준은 아닌 것으로 보인다.

이 뜻은 결국 시장이 현재 지표로 설명되지 않는 몽고DB 프로덕트의 미래가치에 베팅하는 것으로 풀이된다. 이젠 몽고DB의 비즈니스 모델과 프로덕트에 자세히 들어가보자.

몽고DB 역사

몽고DB는 2007년 10gen이라는 회사로 시작되었다. 2008년엔 현재 프로덕트의 기초가 되는 NoSQL 기반 “Document Database(문서형 데이터베이스)”를 오픈소스했다. 그 당시엔 모든 데이터베이스는 SQL 기반 “Relational Database”였으며 큰 인기를 끌지 못했다.

여기서 주로 오픈소스 회사들이 현재는 공짜로 배포하지만 향후 돈을 어떻게 벌지 비즈니스 모델을 엿볼 수 있다(예. RedHat, LangChain 등)

정확히 어떤 시점에 문서형 데이터베이스가 인기를 끌었는지는 모르지만 펀드레이징 역사를 돌이켜보면 어느 정도 유추할 수 있다.

2008~2010년엔 크게 재미없다가 2011~2012년 사이에 조금씩 Use Case가 늘어나면서 올라오더니 2013~2015년엔 MongoDB(몽고DB)로 리브랜딩과 함께 프로덕트(클라우드, 백업, 모니터링, B2B 상품 등) 모양을 갖추더니 시장의 기대가 조금씩 반영되었다고 볼 수 있다.

MongoDB의 이름은 “huMONGOus”에서 따왔다. 매우 큰 워크플로우를 위해 디자인 되었다는 의미이다.

2017년 IPO에선 직전 라운드인 Series F 밸류보다 낮은 수준으로 상장하였지만 현재 어플리케이션 기술 스택(tech stack)과 데이터 아키텍처의 고도화와 AI의 기대감으로 현재 시가총액은 약 26배 껑충 뛰었다.

현재는 약 43,000 이상 고객 베이스를 보유하고 있으며 유일하게 대형 클라우드(AWS, Azure, GCP) 모두의 management console에 탑재된 cloud-agnostic 플레이어다.

데이터베이스란?

몽고DB의 현황에 들어가는 것에 앞서 먼저 기존 Database의 개념에 대해 알아보자. 우리가 사용하는 모든 어플리케이션은 데이터베이스를 기초로 한다.

데이터베이스란 우리의 데이터를 정리하는 곳이다. 엑셀파일도 데이터베이스다. 하지만 개발자들이 말하는 데이터베이스는 MySQL, PostgreSQL과 같은 특화된 소프트웨어를 말한다.

관계형 데이터베이스(relational database)란 엄격한 규칙(schema)에 따라 데이터를 정렬한 데이터베이스를 말한다. 그 반면에 MongoDB 프로덕트의 기초가 되는 문서형 데이터베이스(document database)는 특정된 규칙 없이(schema-less) 데이터를 정리해준다.

간단한 예를 들어보자. 여행 가기 전 짐을 쌀 때, 우리는 두 가지 방법이 있다. 필요한 물건들은 예쁘게 정돈해서 차곡차곡 가방에 쌓는 방법이 있고, 가방에 다 쑤셔 넣는 방법이 있다. 이 두 방법엔 분명한 트레이드오프(trade-off)가 존재한다.
가방에 다 쑤셔 넣는 방법은 짐 싸는 시간을 획기적으로 단축시키고 단순화하지만 나중에 필요한 물건을 찾는 데 어려울 것이다. 데이터베이스에도 똑같은 trade-off가 존재한다.

지금까지 대부분의 어플리케이션은 관계형 데이터베이스로 구축되었다. 개발자들은 SQL(Structured Query Language)이란 “언어”를 통해 데이터베이스와 연동하여 어플리케이션을 작동시킨다.

데이터가 표로 정렬될 수준으로 매우 단순하면 관계형 데이터베이스로도 충분하다. 하지만, 데이터가 매우 복잡하다면(e.g. 비정형 데이터) 어떻게 보관해야 하는가? AI 시대에 비정형 데이터와 스트리밍 데이터가 중요해진 지금, 기존 관계형 데이터베이스의 한계를 알 수 있다.

이런 경우엔 일일이 데이터를 정렬할 규칙을 정의하는 것보다 가방에 때려 넣는 방법(schema-less)이 정답이다. 많은 비정형화 데이터는 정렬이 매우 어렵고, 엔드 어플리케이션의 데이터 니즈가 지속적으로 바뀔 수 있다 보니 상의/하의/양말과 같이 schema가 정해진 데이터베이스 보다 미래에 필요할 수도 있으니 모든 데이터를 다 가방에 때려 넣는게 옳다.

물론, 예쁘게 정돈이 안 되어 있다 보니 찾는 것이 어렵지만 매우 효율적이고 유연하고 높은 양의 데이터를 쉽게 처리할 수 있다. Sharding방식으로 쉽게 horizontal scaling 되며 분산 시스템을 만드는데 용이하다.

몽고DB 아틀라스(프로덕트)

몽고DB의 시초는 데이터를 BSON(Binary JSON) 형태로 저장하는 schema-less NoSQL 문서형 데이터베이스이다. 즉, NoSQL 데이터베이스가 강점이다. 하지만 몽고DB는 현재 NoSQL 뿐만 아니라 SQL 데이터베이스(관계형, 시계열 등)까지 모든 데이터 형태를 하나의 플랫폼으로 서비스하고 있다.

Problem: 오늘 날의 어플리케이션은 계산기와 같은 단순 유틸리티가 아니다. 추천 엔진, 이상 거래 탐지, 광고 네트워크 등의 초개인화, 실시간 기능이 탑재되어 있고 글로벌 고객에게 서비스하기 위해 다양한 deployment model로 연결되어 있다. 우리가 사랑하는 혁신적인 어플리케이션들은 매우 복잡한 데이터베이스 아키텍처로 구성되어 있다. 이 모든 데이터베이스와 기능을 연결하고 고객에게 제공하기 위해 “Point Tools”를 사용한다. 개발자 입장에서 다루기 매우 어렵고 비용이 만만치 않다.

Solution: 최고의 어플리케이션은 정형화된 데이터 뿐만 아니라 비정형화 데이터(NoSQL - Key-Value, Document, Search Engines, Graph 등)까지 모두 활용하여 초개인화, 실시간 서비스를 제공해야 한다. 뿐만 아니라 모든 데이터베이스(SQL 포함)를 하나의 플랫폼으로 통합하여 개발환경을 단순화 해야한다. 이 것이 몽고DB의 주요 프로덕트인 MongoDB Atlas이다.

비즈니스 모델

이 쯤에서 몽고DB가 최근 제출한 2023년 3Q의 10Q (분기보고서)를 통해 비즈니스 모델을 알아보자

몽고DB는 “Developer Data Platform” 회사이다. 유연성과 Reliability를 갖춘 NoSQL 데이터베이스 뿐만 아니라 관계형 데이터베이스까지 서비스한다. 뿐만 아니라 개발자들이 데이터베이스를 200% 활용할 수 있도록 서치, 시계열, 분석과 같은 기능을 제공한다.

“아하, 오픈소스 데이터베이스를 이런 식으로 수익화(monetize)하는구나?”

Revenue Model은 “구독형”이라고 하지만 사용량(workload)에 따른 usage-based pricing으로 보여진다.

몽고DB는 이러한 모델을 DBaaS (Database as a Service)로 지칭한다. 몽고DB 아틀라스는 매출의 약 63%를 차지한다. 몽고DB의 Enterprise Advanced(컨설팅까지 포함된 대기업 향 프로덕트)는 약 26%를 차지한다.

몽고DB는 Community Server, MongoDB Atlas free-tier 등 무료 서비스로 잠재고객을 락인하고 있다. Community Server는 2009년 2월부터 약 4,550만 번 다운로드 되었다. 대부분 몽고DB의 잠재고객은 프로덕트를 사용해본 경험이 있다 보니 세일즈를 더 쉽게 진행할 수 있다고 주장한다.

몽고DB의 가장 중요한 매출 드라이버 (Revenue Driver)는 무엇인가? 1) 신규 고객/워크로드 온보딩 (당연), 2) 기존 고객의 기존 어플리케이션 워크로드 증가 (usage increase), 3) 기존 고객의 신규 어플리케이션 워크로드 Migration으로 볼 수 있다.

사용 사례: Albertsons (Digital Transformation)

(비전공자가) 프로덕트에 대해 가장 잘 이해할 수 있는 방법은 실제 Use Case를 살펴보는 것이다. 미국의 대형 슈퍼마켓 체인 업체인 Albertsons가 몽고DB를 사용하여 어떻게 디지털 트랜스포메이션를 이뤄냈는지 알아보자.

슈퍼마켓은 오래된 산업이다. 그 만큼 기술 스택이 낙후되어 있다. 소비자에게 훌륭한 서비스를 제공하기 위해선 Front-End만 번지르르하게 만드는 것 뿐만 아니라 어플리케이션의 척추가 되는 데이터베이스와 아키텍처의 overhaul (재정비)이 필요하다.

몽고DB는 Albertsons의 엔터프라이즈 프로모션 엔진(enterprise promotion engine)을 작동 시키고 있다. Albertsons는 앱 사용자들의 충성도와 전환율 증가를 위해 초개인화 추천 시스템과 할인 시스템을 도입하고 싶었다. 즉, 어플리케이션은 고객정보, 고객의 선호도, 장바구니, 앱과의 engagement 등 다양한 데이터를 pull해서 2,000여개 스토어에 있는 50,000개+ SKU에 대한 프로모션의 결정을 밀리초(millisecond) 단위로 3,000만 충성고객들을 위해 안정적으로 프로세스/서비스 해야한다.

상상만 해도 개발자 입장에선 끔찍하다. 이 다양한 데이터베이스를 연결할 Point Solution, 데이터를 잘 Query 해줄 수 있는 서치엔진 개발, 3,000만 고객에게 배포할 만한 정확도, 레이턴시(latency)와 안정성을 갖춘 어플리케이션을 기존 낙후된 데이터 아키텍처에서 다른 서비스에 지장이 없도록 만든다는 것은 쉬운 일이 아니다. 문제가 생겼을 경우를 대비해 Observability와 Maintainability, 향후 확장에 대비해 Scalability까지 모두 갖춰야 한다.

이 문제를 어떤 아키텍처로 풀었을까?

Albertsons의 프로모션 엔진 데이터 흐름은 이렇게 된다:

셀러들이 신규 오퍼를 승인하면 해당 데이터는 Databricks의 Kafka Topic과 Apache Spark 내 ML 모델들이 실시간으로 프로세싱 된다.
이 아웃풋 데이터들은 몽고DB에 저장된다. 몽고DB는 메타데이터(meta-data)를 우리 엔진이 잘 읽고 Query할 수 있도록 “read-optimized” 형식으로 변형한다.
엔드 어플리케이션은 API로 몽고DB와 연결되어 있으며 Atlas Search(서치엔진)을 통해 각 고객 성향에 따라 필요한 정보를 Query하고 프로세싱하여 고객에게 비춰준다.

여기서 Atlas Search는 몽고DB의 꽤 중요한 Feature이다. 이전엔 개발자들은 구조가 없는 NoSQL 데이터베이스를 Query하는 것을 매우 어려워했다. 직접 Search Engine을 다른 플랫폼으로 개발하거나 API 바로 밑에 in-memory cache를 추가하여 문제를 풀곤 했다. 물론, 다른 엔진에서 개발한 Search Engine은 개발시간을 지체하며 효용성이 떨어지고, 실시간 스트리밍 데이터가 막대한 와중에 In-Memory Cache는 큰 도움이 안된다. Atlas Search는 개발자들이 직접 개발하거나 In-Memory Cache 없이도 필요한 데이터를 몽고DB에서 편하게 Query를 도와주는 Feature이다.

소비자들이 원하는 오퍼들을 “clip”하면 해당 데이터 또한 몽고DB에 저장된다.
이 오퍼데이터, Clip 데이터, 거래 데이터, 소비자가 자주 사용하는 스토어 위치 등을 파악해 Databricks가 해당 데이터를 알 맞는 스토어에 보내주고 고객은 상점을 찾을 때 자신의 로열티 티어 등에 따라 해당 상품의 할인을 받을 수 있다.
몽고DB는 효율적으로 많은 양의 데이터를 유연하게 저장해주며 이러한 NoSQL 데이터를 API가 원하는 정보를 쉽게 접근할 수 있도록 Search Engine을 제공한다. 또한, 하나의 플랫폼으로 이 서비스를 제공하기 때문에 데이터 아키텍처를 단순화하고 Product-to-Market을 단축 시킬 수 있다.

리스크 사항

내가 지금까지 몽고DB를 쭉 분석해봤을 때 클라비요 분석 때 처럼 명확한 리스크는 보이지 않는다. 몽고DB의 근본적인 리스크는 데이터베이스 산업의 본질과 관련되어 있다.

위 “몽고DB의 시장 평가”에서 S&M 비중에 대해 의문을 제기했었다. “S&M이 매출의 50%나 차지한다. 이는 평균보다 21% 더 높은 수치이며 매우 경쟁이 높고 세일즈 사이클이 긴 특성을 가졌다고 볼 수 있다”라고 얘기했었다.

이미 장기간 동안 구축된 관계형 데이터베이스로 많은 어플리케이션을 만들고 서비스하고 있는 “대기업”을 아무리 Value Proposition이 좋다 한들 하루 아침에 데이터 아키텍처를 통째로 바꿀 것을 설득하기엔 상상만 해도 너무나 어려운 일이다. Switching Cost가 너무 크다. 아래 hurdle이 존재한다:

기존 Schema를 몽고DB 데이터베이스에 어떻게 나타낼 것인가?
기존 모든 어플리케이션은 SQL 기반일텐데 코드를 언제 다 다시 고쳐쓰냐? 에러가 발생하면 어떡하냐?
우리 서비스가 차질이 0이도록 데이터 이관 (migration)을 어떻게 할 것인가?
매니지먼트 뿐만 아니라 구성원(개발자, 데이터 분석가 등)을 어떻게 설득할 것인가?

몽고DB가 이러한 고객을 win over 하는 것은 위 사항을 잠재고객에게 투명하게 잘 설명하고 매우 편리한 방법으로 데이터 이관하는 방법을 제공하면서 퀄리티를 보장할 수 있느냐에 달릴 것으로 보인다. 몽고DB는 지속적으로 이 쪽으로 R&D 투자와 서비스를 추가 제공하고 있다.

경쟁현황도 만만치 않다. 데이터베이스 회사들이 데이터 아키텍처 한 부분의 솔루션이 아닌 “통합 플랫폼”으로의 전환을 하면서 선이 애매해지고 있다. 몽고DB를 포함해 데이터 웨어하우스 업체인 스노우플레이크, 빅 데이터 프로세싱 업체인 데이터브릭스 모두 고객이 자체 플랫폼 워크로드를 더 많이 사용하고 붙잡아 놓도록 기능을 확장하고 있다. 뿐만 아니라 마이크로소프트, 오라클, 아마존 등 대형 클라우드 플레이어, 기존 관계형 데이터베이스, 새롭게 등장한 AI에 필수적인 벡터DB 등 버티컬 솔루션 업체들 또한 시장 파이를 갉아먹고 있다.

클라비요 또한 잠재 경쟁사이다. 클라비요의 주요 프로덕트는 퍼스트파티 데이터를 잘 활용하게 해주는 클라우드 데이터 웨어하우스이다. 2021년 클라비요는 NoSQL 데이터베이스로 확장하면서 마케팅 버티컬 내 데이터의 독식을 시도하고 있다.

이에 따라 현재로썬 S&M이 매우 높게 지속될 수 밖에 없는 구조이다. 공격적으로 S&M에 투자하여 고객을 온보딩 시키고 락인 시켜야한다. 몽고DB의 상대적으로 낮은 Payback Period는 여기서 매우 큰 강점으로 작동할 것이다.

또한, 데이터 아키텍처 구조 상 한 번에 높은 contract win이 있는 것이 아니라 조금씩 야금야금 워크로드를 온보딩하는 구조로 보이기 때문에 당분간은 엄청난 매출 성장을 기대하는 것은 어렵다. 하나의 데이터베이스 회사가 대형고객의 100% 월렛셰어(wallet share)를 가져가긴 어려울 것이지만 얼마나 좋은 프로덕트와 개발환경으로 조금씩 확장해 나가느냐가 중요한 싸움일 것이다.

주요 성장 드라이버

지금까지 주요 프로덕트(Atlas)와 비즈니스 모델에 대해 알아봤고 또 데이터 산업구조 상 단기간 내 높은 성장을 기대하기엔 어렵다는 것도 알게 되었다. 그럼 도대체 왜 시장은 몽고DB를 이렇게 높게 평가하는가?

개인적으론 AI/ML 혁명에 따른 소프트웨어 혁신속도와 연계되어 있다고 본다. 똑똑한 어플리케이션들은 실시간성 비정형화 데이터 관리/활용 능력이 필수적이며 시장에선 이 기능을 제일 잘 제공하는 몽고DB를 탑 플레이어로 보고 있다.

AI가 탑재되면서 대부분의 어플리케이션들은 데이터 아키텍처가 한층 더 복잡해 질 것이다. 이미 복잡한 아키텍처에서 AI모델에 사용되는 벡터DB까지 탑재된다고 생각해보자. 개별적인 DB와 포인트 솔루션을 연결 사용하는 것보다 통합된 플랫폼을 사용하는 니즈가 상승한다.

우리가 생각하는 최고의 어플리케이션은 어떤 특성을 갖고 있는가? 1) 많은 동시접속자를 2) 안정적이며 3) 빠르게 4) 초개인화 서비스를 제공해야 한다. 즉, 실시간 스트리밍 데이터(streaming data)를 잘 관리하는 통합 플랫폼의 니즈가 크다.

Why now? 지금까지 기존 어플리케이션들은 위 기능들(초개인화 등)을 굳이 서비스하지 않아도 괜찮았을 것이다. 즉, 데이터 이관(migration), 기술스택 변경 등과 같은 번거로운 일 할 필요 없이 잘 먹고 잘 살았다. AI 혁명으로 인해 많은 회사들은 더 이상 혁신을 미룰 수 없을 것이며 AI로 인해 몽고DB 내 워크로드가 기하급수적으로 증가할 것이다.

Conclusion

이번 포스트에선 시장에서 가장 기대하고 있는 데이터베이스 회사인 몽고DB를 분석해봤다.

몽고DB의 현재가는 AI 기대감이 많이 반영된 수준이며 시장의 AI proxy로 보더라도 과언이 아니다. 개인적인 경험으론 시장에선 AI의 파급력이 상당할 것으로 보고 있다. 즉, 시장이 기대하고 있는 AI의 기존 소프트웨어 스택의 혁신속도가 늦어질 경우도 몽고DB의 Downside 리스크다.

한 팟캐스트에서 Stripe의 가치에 대해 이렇게 얘기했었다: Stripe 외에 Payment Processing 하는 곳들은 이미 너무 많다. Stripe의 가치는 Payment Processing을 혁신한 것이 아니라 사용자 편리 Development Platform 환경을 구축한 것에 있다. OpenAI도 똑같다. Stripe과 OpenAI 모두 기술력 물론 훌륭하지만 장기적 가치 면에선 사용자/개발자에게 얼마나 편한 개발환경을 제공하느냐에 있다고 본다. 몽고DB 프로덕트의 가치 또한 여기 있지 않나 싶다.

단기적인 주가실적은 재껴두고 보면 몽고DB는 AI/ML 밸류체인 내 매우 중요한 역할을 할 플레이어로 보이며 계속 모니터링할 가치가 있는 회사다.

관련해서 테크든 기업분석에 대한 질문, 조언, 피드백이 있으신 분들은 아래 LinkedIn을 통해 연락 주시면 감사하겠습니다.

Contents

Investing

#7 MongoDB Deep Dive - 몽고DB 분석

몽고DB(NASDAQ:MDB)는 뭐 하는 회사인지, 왜 이렇게 높게 평가 받는지 알아보자

Nov 15, 2023

Contents

비전공자(경영학과)인 내가 봐도 이해하기 쉽게 MongoDB의 비즈니스 모델, 프로덕트, 리스크 사항 등을 시장 관점으로 알아보자.

몽고DB의 시장 평가

경영학도로서 먼저 프로덕트 분석을 들어가는 것보다 시장이 이 회사를 어떻게 평가하는가 등 빅픽처를 먼저 보는 것을 선호한다(주요 SaaS 지표 정리).

미국 내 상장 된 Enterprise SaaS 업체 중 몽고DB는 NTM(Next Twelve Months) 매출 멀티플 상 Snowflake 다음으로 2등으로 가장 높은 평가를 받고 있다.

왜 그럴까? 먼저 다른 80여개 SaaS 플레이어들의 평균과 몽고DB의 지표 비교를 해보자.

FCF: NTM FCF 멀티플도 133배 수준으로 매우 높은 편이다. 현금창출 능력이 좋다고 볼 수 없다.
Rev Growth: 매출 성장률도 전체 2등이 될 정도로 뛰어나다고 볼 수 없다. 특히, NTM 매출 성장률은 17%이고, 이는 평균수치인 15%를 겨우 우회하는 수준이다.
S&M: 세일즈/마케팅 비용이 매출의 50%나 차지한다. 이는 평균보다 21% 더 높은 수치이며 매우 경쟁이 높고 세일즈 사이클이 긴 특성을 가졌다고 볼 수 있다.
Net Expansion: 120%로 평균보다 높은 수치이지만 Snowflake(142%) 수준까진 아니다.
GM Adj. Payback: 13개월로 매우 훌륭한 과금 체계(Pricing Policy)를 갖고 있다.

지표만 놓고 봤을 때, 몽고DB는 S&M 투자가 많이 필요할 정도로 매우 치열한 경쟁이 펼쳐지는 시장에 있지만 한 번 고객을 온보딩할 경우, 빠르게 투자금을 회수할 수 있는 프로덕트라고 볼 수 있다. 하지만, 이 지표만 놓고 봤을 때, 상대적으로 몽고DB는 NTM 14.6배의 고평가를 받을 수준은 아닌 것으로 보인다.

이 뜻은 결국 시장이 현재 지표로 설명되지 않는 몽고DB 프로덕트의 미래가치에 베팅하는 것으로 풀이된다. 이젠 몽고DB의 비즈니스 모델과 프로덕트에 자세히 들어가보자.

몽고DB 역사

몽고DB는 2007년 10gen이라는 회사로 시작되었다. 2008년엔 현재 프로덕트의 기초가 되는 NoSQL 기반 “Document Database(문서형 데이터베이스)”를 오픈소스했다. 그 당시엔 모든 데이터베이스는 SQL 기반 “Relational Database”였으며 큰 인기를 끌지 못했다.

여기서 주로 오픈소스 회사들이 현재는 공짜로 배포하지만 향후 돈을 어떻게 벌지 비즈니스 모델을 엿볼 수 있다(예. RedHat, LangChain 등)

정확히 어떤 시점에 문서형 데이터베이스가 인기를 끌었는지는 모르지만 펀드레이징 역사를 돌이켜보면 어느 정도 유추할 수 있다.

2008~2010년엔 크게 재미없다가 2011~2012년 사이에 조금씩 Use Case가 늘어나면서 올라오더니 2013~2015년엔 MongoDB(몽고DB)로 리브랜딩과 함께 프로덕트(클라우드, 백업, 모니터링, B2B 상품 등) 모양을 갖추더니 시장의 기대가 조금씩 반영되었다고 볼 수 있다.

MongoDB의 이름은 “huMONGOus”에서 따왔다. 매우 큰 워크플로우를 위해 디자인 되었다는 의미이다.

2017년 IPO에선 직전 라운드인 Series F 밸류보다 낮은 수준으로 상장하였지만 현재 어플리케이션 기술 스택(tech stack)과 데이터 아키텍처의 고도화와 AI의 기대감으로 현재 시가총액은 약 26배 껑충 뛰었다.

현재는 약 43,000 이상 고객 베이스를 보유하고 있으며 유일하게 대형 클라우드(AWS, Azure, GCP) 모두의 management console에 탑재된 cloud-agnostic 플레이어다.

데이터베이스란?

몽고DB의 현황에 들어가는 것에 앞서 먼저 기존 Database의 개념에 대해 알아보자. 우리가 사용하는 모든 어플리케이션은 데이터베이스를 기초로 한다.

데이터베이스란 우리의 데이터를 정리하는 곳이다. 엑셀파일도 데이터베이스다. 하지만 개발자들이 말하는 데이터베이스는 MySQL, PostgreSQL과 같은 특화된 소프트웨어를 말한다.

관계형 데이터베이스(relational database)란 엄격한 규칙(schema)에 따라 데이터를 정렬한 데이터베이스를 말한다. 그 반면에 MongoDB 프로덕트의 기초가 되는 문서형 데이터베이스(document database)는 특정된 규칙 없이(schema-less) 데이터를 정리해준다.

간단한 예를 들어보자. 여행 가기 전 짐을 쌀 때, 우리는 두 가지 방법이 있다. 필요한 물건들은 예쁘게 정돈해서 차곡차곡 가방에 쌓는 방법이 있고, 가방에 다 쑤셔 넣는 방법이 있다. 이 두 방법엔 분명한 트레이드오프(trade-off)가 존재한다.
가방에 다 쑤셔 넣는 방법은 짐 싸는 시간을 획기적으로 단축시키고 단순화하지만 나중에 필요한 물건을 찾는 데 어려울 것이다. 데이터베이스에도 똑같은 trade-off가 존재한다.

지금까지 대부분의 어플리케이션은 관계형 데이터베이스로 구축되었다. 개발자들은 SQL(Structured Query Language)이란 “언어”를 통해 데이터베이스와 연동하여 어플리케이션을 작동시킨다.

데이터가 표로 정렬될 수준으로 매우 단순하면 관계형 데이터베이스로도 충분하다. 하지만, 데이터가 매우 복잡하다면(e.g. 비정형 데이터) 어떻게 보관해야 하는가? AI 시대에 비정형 데이터와 스트리밍 데이터가 중요해진 지금, 기존 관계형 데이터베이스의 한계를 알 수 있다.

이런 경우엔 일일이 데이터를 정렬할 규칙을 정의하는 것보다 가방에 때려 넣는 방법(schema-less)이 정답이다. 많은 비정형화 데이터는 정렬이 매우 어렵고, 엔드 어플리케이션의 데이터 니즈가 지속적으로 바뀔 수 있다 보니 상의/하의/양말과 같이 schema가 정해진 데이터베이스 보다 미래에 필요할 수도 있으니 모든 데이터를 다 가방에 때려 넣는게 옳다.

물론, 예쁘게 정돈이 안 되어 있다 보니 찾는 것이 어렵지만 매우 효율적이고 유연하고 높은 양의 데이터를 쉽게 처리할 수 있다. Sharding방식으로 쉽게 horizontal scaling 되며 분산 시스템을 만드는데 용이하다.

몽고DB 아틀라스(프로덕트)

몽고DB의 시초는 데이터를 BSON(Binary JSON) 형태로 저장하는 schema-less NoSQL 문서형 데이터베이스이다. 즉, NoSQL 데이터베이스가 강점이다. 하지만 몽고DB는 현재 NoSQL 뿐만 아니라 SQL 데이터베이스(관계형, 시계열 등)까지 모든 데이터 형태를 하나의 플랫폼으로 서비스하고 있다.

Problem: 오늘 날의 어플리케이션은 계산기와 같은 단순 유틸리티가 아니다. 추천 엔진, 이상 거래 탐지, 광고 네트워크 등의 초개인화, 실시간 기능이 탑재되어 있고 글로벌 고객에게 서비스하기 위해 다양한 deployment model로 연결되어 있다. 우리가 사랑하는 혁신적인 어플리케이션들은 매우 복잡한 데이터베이스 아키텍처로 구성되어 있다. 이 모든 데이터베이스와 기능을 연결하고 고객에게 제공하기 위해 “Point Tools”를 사용한다. 개발자 입장에서 다루기 매우 어렵고 비용이 만만치 않다.

Solution: 최고의 어플리케이션은 정형화된 데이터 뿐만 아니라 비정형화 데이터(NoSQL - Key-Value, Document, Search Engines, Graph 등)까지 모두 활용하여 초개인화, 실시간 서비스를 제공해야 한다. 뿐만 아니라 모든 데이터베이스(SQL 포함)를 하나의 플랫폼으로 통합하여 개발환경을 단순화 해야한다. 이 것이 몽고DB의 주요 프로덕트인 MongoDB Atlas이다.

비즈니스 모델

이 쯤에서 몽고DB가 최근 제출한 2023년 3Q의 10Q (분기보고서)를 통해 비즈니스 모델을 알아보자

몽고DB는 “Developer Data Platform” 회사이다. 유연성과 Reliability를 갖춘 NoSQL 데이터베이스 뿐만 아니라 관계형 데이터베이스까지 서비스한다. 뿐만 아니라 개발자들이 데이터베이스를 200% 활용할 수 있도록 서치, 시계열, 분석과 같은 기능을 제공한다.

“아하, 오픈소스 데이터베이스를 이런 식으로 수익화(monetize)하는구나?”

Revenue Model은 “구독형”이라고 하지만 사용량(workload)에 따른 usage-based pricing으로 보여진다.

몽고DB는 이러한 모델을 DBaaS (Database as a Service)로 지칭한다. 몽고DB 아틀라스는 매출의 약 63%를 차지한다. 몽고DB의 Enterprise Advanced(컨설팅까지 포함된 대기업 향 프로덕트)는 약 26%를 차지한다.

몽고DB는 Community Server, MongoDB Atlas free-tier 등 무료 서비스로 잠재고객을 락인하고 있다. Community Server는 2009년 2월부터 약 4,550만 번 다운로드 되었다. 대부분 몽고DB의 잠재고객은 프로덕트를 사용해본 경험이 있다 보니 세일즈를 더 쉽게 진행할 수 있다고 주장한다.

몽고DB의 가장 중요한 매출 드라이버 (Revenue Driver)는 무엇인가? 1) 신규 고객/워크로드 온보딩 (당연), 2) 기존 고객의 기존 어플리케이션 워크로드 증가 (usage increase), 3) 기존 고객의 신규 어플리케이션 워크로드 Migration으로 볼 수 있다.

사용 사례: Albertsons (Digital Transformation)

(비전공자가) 프로덕트에 대해 가장 잘 이해할 수 있는 방법은 실제 Use Case를 살펴보는 것이다. 미국의 대형 슈퍼마켓 체인 업체인 Albertsons가 몽고DB를 사용하여 어떻게 디지털 트랜스포메이션를 이뤄냈는지 알아보자.

슈퍼마켓은 오래된 산업이다. 그 만큼 기술 스택이 낙후되어 있다. 소비자에게 훌륭한 서비스를 제공하기 위해선 Front-End만 번지르르하게 만드는 것 뿐만 아니라 어플리케이션의 척추가 되는 데이터베이스와 아키텍처의 overhaul (재정비)이 필요하다.

몽고DB는 Albertsons의 엔터프라이즈 프로모션 엔진(enterprise promotion engine)을 작동 시키고 있다. Albertsons는 앱 사용자들의 충성도와 전환율 증가를 위해 초개인화 추천 시스템과 할인 시스템을 도입하고 싶었다. 즉, 어플리케이션은 고객정보, 고객의 선호도, 장바구니, 앱과의 engagement 등 다양한 데이터를 pull해서 2,000여개 스토어에 있는 50,000개+ SKU에 대한 프로모션의 결정을 밀리초(millisecond) 단위로 3,000만 충성고객들을 위해 안정적으로 프로세스/서비스 해야한다.

상상만 해도 개발자 입장에선 끔찍하다. 이 다양한 데이터베이스를 연결할 Point Solution, 데이터를 잘 Query 해줄 수 있는 서치엔진 개발, 3,000만 고객에게 배포할 만한 정확도, 레이턴시(latency)와 안정성을 갖춘 어플리케이션을 기존 낙후된 데이터 아키텍처에서 다른 서비스에 지장이 없도록 만든다는 것은 쉬운 일이 아니다. 문제가 생겼을 경우를 대비해 Observability와 Maintainability, 향후 확장에 대비해 Scalability까지 모두 갖춰야 한다.

이 문제를 어떤 아키텍처로 풀었을까?

Albertsons의 프로모션 엔진 데이터 흐름은 이렇게 된다:

셀러들이 신규 오퍼를 승인하면 해당 데이터는 Databricks의 Kafka Topic과 Apache Spark 내 ML 모델들이 실시간으로 프로세싱 된다.
이 아웃풋 데이터들은 몽고DB에 저장된다. 몽고DB는 메타데이터(meta-data)를 우리 엔진이 잘 읽고 Query할 수 있도록 “read-optimized” 형식으로 변형한다.
엔드 어플리케이션은 API로 몽고DB와 연결되어 있으며 Atlas Search(서치엔진)을 통해 각 고객 성향에 따라 필요한 정보를 Query하고 프로세싱하여 고객에게 비춰준다.

여기서 Atlas Search는 몽고DB의 꽤 중요한 Feature이다. 이전엔 개발자들은 구조가 없는 NoSQL 데이터베이스를 Query하는 것을 매우 어려워했다. 직접 Search Engine을 다른 플랫폼으로 개발하거나 API 바로 밑에 in-memory cache를 추가하여 문제를 풀곤 했다. 물론, 다른 엔진에서 개발한 Search Engine은 개발시간을 지체하며 효용성이 떨어지고, 실시간 스트리밍 데이터가 막대한 와중에 In-Memory Cache는 큰 도움이 안된다. Atlas Search는 개발자들이 직접 개발하거나 In-Memory Cache 없이도 필요한 데이터를 몽고DB에서 편하게 Query를 도와주는 Feature이다.

소비자들이 원하는 오퍼들을 “clip”하면 해당 데이터 또한 몽고DB에 저장된다.
이 오퍼데이터, Clip 데이터, 거래 데이터, 소비자가 자주 사용하는 스토어 위치 등을 파악해 Databricks가 해당 데이터를 알 맞는 스토어에 보내주고 고객은 상점을 찾을 때 자신의 로열티 티어 등에 따라 해당 상품의 할인을 받을 수 있다.
몽고DB는 효율적으로 많은 양의 데이터를 유연하게 저장해주며 이러한 NoSQL 데이터를 API가 원하는 정보를 쉽게 접근할 수 있도록 Search Engine을 제공한다. 또한, 하나의 플랫폼으로 이 서비스를 제공하기 때문에 데이터 아키텍처를 단순화하고 Product-to-Market을 단축 시킬 수 있다.

리스크 사항

내가 지금까지 몽고DB를 쭉 분석해봤을 때 클라비요 분석 때 처럼 명확한 리스크는 보이지 않는다. 몽고DB의 근본적인 리스크는 데이터베이스 산업의 본질과 관련되어 있다.

위 “몽고DB의 시장 평가”에서 S&M 비중에 대해 의문을 제기했었다. “S&M이 매출의 50%나 차지한다. 이는 평균보다 21% 더 높은 수치이며 매우 경쟁이 높고 세일즈 사이클이 긴 특성을 가졌다고 볼 수 있다”라고 얘기했었다.

이미 장기간 동안 구축된 관계형 데이터베이스로 많은 어플리케이션을 만들고 서비스하고 있는 “대기업”을 아무리 Value Proposition이 좋다 한들 하루 아침에 데이터 아키텍처를 통째로 바꿀 것을 설득하기엔 상상만 해도 너무나 어려운 일이다. Switching Cost가 너무 크다. 아래 hurdle이 존재한다:

기존 Schema를 몽고DB 데이터베이스에 어떻게 나타낼 것인가?
기존 모든 어플리케이션은 SQL 기반일텐데 코드를 언제 다 다시 고쳐쓰냐? 에러가 발생하면 어떡하냐?
우리 서비스가 차질이 0이도록 데이터 이관 (migration)을 어떻게 할 것인가?
매니지먼트 뿐만 아니라 구성원(개발자, 데이터 분석가 등)을 어떻게 설득할 것인가?

몽고DB가 이러한 고객을 win over 하는 것은 위 사항을 잠재고객에게 투명하게 잘 설명하고 매우 편리한 방법으로 데이터 이관하는 방법을 제공하면서 퀄리티를 보장할 수 있느냐에 달릴 것으로 보인다. 몽고DB는 지속적으로 이 쪽으로 R&D 투자와 서비스를 추가 제공하고 있다.

경쟁현황도 만만치 않다. 데이터베이스 회사들이 데이터 아키텍처 한 부분의 솔루션이 아닌 “통합 플랫폼”으로의 전환을 하면서 선이 애매해지고 있다. 몽고DB를 포함해 데이터 웨어하우스 업체인 스노우플레이크, 빅 데이터 프로세싱 업체인 데이터브릭스 모두 고객이 자체 플랫폼 워크로드를 더 많이 사용하고 붙잡아 놓도록 기능을 확장하고 있다. 뿐만 아니라 마이크로소프트, 오라클, 아마존 등 대형 클라우드 플레이어, 기존 관계형 데이터베이스, 새롭게 등장한 AI에 필수적인 벡터DB 등 버티컬 솔루션 업체들 또한 시장 파이를 갉아먹고 있다.

클라비요 또한 잠재 경쟁사이다. 클라비요의 주요 프로덕트는 퍼스트파티 데이터를 잘 활용하게 해주는 클라우드 데이터 웨어하우스이다. 2021년 클라비요는 NoSQL 데이터베이스로 확장하면서 마케팅 버티컬 내 데이터의 독식을 시도하고 있다.

이에 따라 현재로썬 S&M이 매우 높게 지속될 수 밖에 없는 구조이다. 공격적으로 S&M에 투자하여 고객을 온보딩 시키고 락인 시켜야한다. 몽고DB의 상대적으로 낮은 Payback Period는 여기서 매우 큰 강점으로 작동할 것이다.

또한, 데이터 아키텍처 구조 상 한 번에 높은 contract win이 있는 것이 아니라 조금씩 야금야금 워크로드를 온보딩하는 구조로 보이기 때문에 당분간은 엄청난 매출 성장을 기대하는 것은 어렵다. 하나의 데이터베이스 회사가 대형고객의 100% 월렛셰어(wallet share)를 가져가긴 어려울 것이지만 얼마나 좋은 프로덕트와 개발환경으로 조금씩 확장해 나가느냐가 중요한 싸움일 것이다.

주요 성장 드라이버

지금까지 주요 프로덕트(Atlas)와 비즈니스 모델에 대해 알아봤고 또 데이터 산업구조 상 단기간 내 높은 성장을 기대하기엔 어렵다는 것도 알게 되었다. 그럼 도대체 왜 시장은 몽고DB를 이렇게 높게 평가하는가?

개인적으론 AI/ML 혁명에 따른 소프트웨어 혁신속도와 연계되어 있다고 본다. 똑똑한 어플리케이션들은 실시간성 비정형화 데이터 관리/활용 능력이 필수적이며 시장에선 이 기능을 제일 잘 제공하는 몽고DB를 탑 플레이어로 보고 있다.

AI가 탑재되면서 대부분의 어플리케이션들은 데이터 아키텍처가 한층 더 복잡해 질 것이다. 이미 복잡한 아키텍처에서 AI모델에 사용되는 벡터DB까지 탑재된다고 생각해보자. 개별적인 DB와 포인트 솔루션을 연결 사용하는 것보다 통합된 플랫폼을 사용하는 니즈가 상승한다.

우리가 생각하는 최고의 어플리케이션은 어떤 특성을 갖고 있는가? 1) 많은 동시접속자를 2) 안정적이며 3) 빠르게 4) 초개인화 서비스를 제공해야 한다. 즉, 실시간 스트리밍 데이터(streaming data)를 잘 관리하는 통합 플랫폼의 니즈가 크다.

Why now? 지금까지 기존 어플리케이션들은 위 기능들(초개인화 등)을 굳이 서비스하지 않아도 괜찮았을 것이다. 즉, 데이터 이관(migration), 기술스택 변경 등과 같은 번거로운 일 할 필요 없이 잘 먹고 잘 살았다. AI 혁명으로 인해 많은 회사들은 더 이상 혁신을 미룰 수 없을 것이며 AI로 인해 몽고DB 내 워크로드가 기하급수적으로 증가할 것이다.

Conclusion

이번 포스트에선 시장에서 가장 기대하고 있는 데이터베이스 회사인 몽고DB를 분석해봤다.

몽고DB의 현재가는 AI 기대감이 많이 반영된 수준이며 시장의 AI proxy로 보더라도 과언이 아니다. 개인적인 경험으론 시장에선 AI의 파급력이 상당할 것으로 보고 있다. 즉, 시장이 기대하고 있는 AI의 기존 소프트웨어 스택의 혁신속도가 늦어질 경우도 몽고DB의 Downside 리스크다.

한 팟캐스트에서 Stripe의 가치에 대해 이렇게 얘기했었다: Stripe 외에 Payment Processing 하는 곳들은 이미 너무 많다. Stripe의 가치는 Payment Processing을 혁신한 것이 아니라 사용자 편리 Development Platform 환경을 구축한 것에 있다. OpenAI도 똑같다. Stripe과 OpenAI 모두 기술력 물론 훌륭하지만 장기적 가치 면에선 사용자/개발자에게 얼마나 편한 개발환경을 제공하느냐에 있다고 본다. 몽고DB 프로덕트의 가치 또한 여기 있지 않나 싶다.

단기적인 주가실적은 재껴두고 보면 몽고DB는 AI/ML 밸류체인 내 매우 중요한 역할을 할 플레이어로 보이며 계속 모니터링할 가치가 있는 회사다.

관련해서 테크든 기업분석에 대한 질문, 조언, 피드백이 있으신 분들은 아래 LinkedIn을 통해 연락 주시면 감사하겠습니다.

Contents