Reader's Favorites AI/SaaS Opinion Investing

GPT-wrapper의 한계를 넘어: 2세대 AI 어플리케이션의 도약

Jason Lee

Apr 06, 2025

Contents

1세대 AI 어플리케이션 1세대 AI 어플리케이션이 실패한 이유 1세대 어플리케이션이 가졌던 가설 폐허 속에서: 2세대 AI 어플리케이션의 시작 성공한 2세대 AI 어플리케이션의 특징 Conclusion

1세대 AI 어플리케이션

2022년 11월, GPT 3.5 기반의 ChatGPT가 출시되고 생성형 AI의 놀라운 성능과 무궁무진한 가능성에 수많은 사람들이 열광했죠.

몇 달 뒤인 2023년 초, API가 공개되자 수많은 개발자들이 달려들어 AI 어플리케이션을 만들기 시작했습니다. Stable Diffusion, Llama 모델 등 오픈소스 모델들도 출시되자 하룻밤 사이 빅테크 외 접근하기 어려웠던 SOTA 모델을 누구나 사용할 수 있게 되었습니다.

그 결과, 파운데이션 모델의 capability를 활용한 어플리케이션들이 폭발적인 속도로 시장에 쏟아졌습니다. 예를 들어, 미국 졸업사진 프로필 이미지 생성 서비스, “Chat with PDF” 서비스, 광고 특화 문구 생성 서비스 등을 기억하시는 분들도 있을 텐데요. 이들 서비스는 초기에 이례적인 속도로 사용자들의 관심을 이끌었습니다.

이 엄청난 속도를 가능케 했던 이유는 크게 두 가지라고 생각합니다. 첫 번째는 novelty factor, 즉 “wow factor”입니다. 생성형 AI는 재미있는 바이럴 요소가 많았고, 이러한 재밌는 아웃풋들이 빠르게 입소문을 타면서 순식간에 큰 인기를 일으켰습니다.

두 번째 이유는 이러한 서비스는 생성형 AI가 가능케한 완벽히 새로운 서비스였다는 점입니다. 흔히 스타트업이 incumbent를 이기려면 프로덕트가 “10x better”여야 한다고 하죠. 기존 기업이 갖고 있는 distribution, 브랜드, 신뢰도, 락인 효과 등의 advantage를 깨기 위해서는 2~3배 나은 수준이 아니라 아예 압도적으로 10x 좋아야만 한다는 뜻입니다. 다만, 생성형 AI가 등장했을 때는 incumbent가 없는 상황에서 소규모 팀들이 빈 시장에 바이럴 요소에 힘입어 엄청난 속도로 확장을 이룰 수 있었습니다.

하지만 Lensa AI, Jasper, Chat with PDF 등 초기에 바이럴을 누렸던 대부분의 서비스들은 결국 우리 기억 속에서 거의 사라졌습니다. 이들 서비스가 공통적으로 지닌 치명적 약점은 underlying AI 모델이 이미 할 수 있는 수준을 크게 넘어서지 못했다는 점입니다. 이 들은 모델의 capability 그 자체에만 의존했기 때문에, 그 신선함이 식고 더 큰 플레이어들이 비슷한 기능을 추가하자마자 사라졌습니다.

개인적으로 저는(제 마음대로) 이런 서비스들을 “1세대 AI 어플리케이션”이라고 부릅니다. 1세대 AI 어플리케이션은 프로덕트가 곧 AI 모델이였고, 그 외 사용자 경험이나 UI에 대한 고민은 적었다고 생각합니다(99.9% 파운데이션 모델, 0.1% 매우 thin layer의 UI?).

이런 서비스들을 GPT-wrapper라고 시장에서 비판 받았습니다.

1세대 AI 어플리케이션이 실패한 이유

투자자로서 이 흐름은 굉장히 흥미로우면서도 동시에 우려스러웠습니다. 흥미로웠던 이유는, 2021년 이후로 극도로 얼어붙은 스타트업 시장에 생성형 AI가 새로운 패러다임 시프트로 다가오면서 다시금 스타트업 씬에 활력을 불어넣었기 때문입니다. VC들은 투자 집행을 통해 자기 존재 가치를 정당화하는데, 갈 곳 없던 자금이 생성형 AI 분야로 몰려들면서 딜이 활발히 이뤄지고, 침체되어 있던 VC 업계 역시 새로운 기대감으로 가득 차게 되었죠.

반면 걱정스러웠던 점은, 아무리 다양한 AI 창업자들과 대화를 나눠보고 고민해보더라도 1세대 AI 어플리케이션의 장기적인 competitive edge에 대해 납득이 되지 않았다는 점입니다.

당시 제 눈에 보인 것은 매우 간단한 UI/UX를 갖춘 모델 중심의 프로덕트였습니다. 처음에는 first-mover advantage와 강력한 바이럴 효과로 빠르게 성장하고 압도적인 지표를 만들었어도 모델이 곧 프로덕트인 형태로는 차별화를 이루기 어려웠다고 판단했습니다.

저는 AI 어플리케이션 시장에서 결코 유저 수가 그 자체만으로 경쟁력이 된다고 판단하지 않습니다. 오히려 장기적으로 독이 된다고 생각했었습니다.

절대적인 유저 수가 장기적 moat로 활약하는 분야는 크게 2가지라고 생각합니다. 1) 네트워크 효과를 발휘할 수 있는 SNS, 플랫폼 성격의 사업모델과

💡

Network Effect - Metcalfe’s Law

2) 높은 전환비용(switching cost)로 고객을 lock-in (high retention) 시킬 수 있어 높은 Lifetime Value (LTV)를 갖춘 엔터프라이즈 소프트웨어 성격의 모델입니다.

💡

Relationship between LTV and Retention 예시

예를 들어 우버(Uber) 같은 플랫폼은 초기에 엄청난 마케팅 비용과 보조금을 투입해 유저와 드라이버를 끌어들이기 위해 경쟁했습니다. 한 명의 유저를 확보하면 플랫폼 전체의 가치가 올라가는 구조였기에 장기적인 경쟁 우위를 확보하기 위해서는 정당하고 필수적이었던 투자였습니다. 실제로 우버의 현금흐름에서 이 트렌드를 목격할 수 있죠 ($28B free cash flow run rate by end of 2024!).

하지만 대부분의 AI 서비스들은 1) 네트워크 효과를 활용할 수 있는 BM도, 2) 높은 switching cost를 가진 BM도 아닙니다. 한 명의 유저가 늘어났다고 해서 서비스 전체의 가치가 비례해서 커지지 않고, 소비자들은 hype에 따라 빠르게 유입되고 그 만큼 빠르게 이탈합니다.

그렇다보니 플랫폼들과 엔터프라이즈 소프트웨어 사업과는 다르게 모순적으로 유저들은 “자산”이 아니라 “부채”의 성격에 가깝습니다.

이들은 유저 확보와 retention을 위해 모델 인퍼런스(inference) 비용을 대부분 자신이 직접 부담했습니다. Even worse, 심지어 더 많은 유저확보를 위해 거대한 마케팅 캠페인을 집행하기도 했죠. 고객들의 지불용의(willingness to pay)가 명확하지 않은 상태에서 마케팅 캠페인을 통해 더욱 많은 유입이 일어나면 그에 비례해서 증가한 사용량에 따라 인퍼런스 비용을 부담합니다.

더 많은 펀드레이징, 더 많은 지분 희석, 더 높아진 리스크.

결국 많은 사용자를 모은 어플리케이션이라 하더라도 근시일 내에 monetization에 들어가면 대다수 유저가 이탈할 것으로 예상했습니다. 아무리 선두주자라 해도, 똑같은 서비스를 제공하는 경쟁 어플리케이션들이 100개 이상 우후죽순 등장하고 있었으니까요. 네트워크 효과나 높은 전환 비용이라는 moat가 없다 보니, 초기 1세대 AI 어플리케이션들이 제시했던 밸류에이션은 장기적 관점에서 정당화하기 쉽지 않았습니다.

1세대 어플리케이션이 가졌던 가설

몇몇 분들은 “사용자 확보를 통해 어플리케이션 내 쌓인 데이터를 사용하면 그게 곧 moat가 되지 않을까?”라고 말하기도 했습니다. 실제로 많은 기업들과 투자자들이 이러한 주장을 폈고요. 하지만 제 개인적인 의견은 부정적입니다.

먼저, 그렇게 해서 확보된 데이터가 충분히 가치가 있느냐에서 회의적입니다. 사용자의 간단한 인터랙션에서 얻어진 데이터는 1) 그 양이 충분히 크지 않고 (not scalable enough), 2) 모델을 획기적으로 개선하기엔 그 데이터의 가치가 부족(not high enough value)하다고 봤습니다.

두번째론 위 가설은 투자 관점에서 본다면 해당 스타트업이 더 많은 유저와 데이터 확보를 위해 지속적으로 거대한 마케팅 비용과 유저들을 위해 인퍼런스 비용을 subsidize하겠다는 의미이기도 합니다. 대부분의 스타트업은 OpenAI나 xAI처럼 자본 조달비용(cost of capital)이 낮은 기업이 아니므로, 장기적으로 이 전략은 매우 risky합니다.

세번째론 위 주장은 “AI 발전 속도가 느릴 것”이라는 전제를 깔고 있습니다. 일부는 “지금 나온 최신 모델이 한동안 SoTA(state-of-the-art)를 유지할 것”이라 가정하고, 그 사이에 강력한 distribution이나 독점 데이터로 fine-tuning하는 등 진입장벽을 구축할 시간을 벌 수 있을 것이라 여겼습니다. 하지만 실제로는 몇 주, 몇 달 단위로 모델이 점진적이 아니라 step change function으로 발전했고, 그때마다 새로운 경쟁자가 쏟아져 나오고, ChatGPT 같은 범용 어플리케이션의 capability가 추가되면서 이들이 만들어낸 근소한 advantage는 순식간에 무력화 되었습니다. 이러한 추세는 지속될 것이라고 생각합니다.

2024년 4월, 저에게 인상 깊었던 인터뷰에서 Sam Altman이 AI 스타트업들에게 경고했습니다:

“There’s one strategy which is to assume the model is not going to get better and then you build all these little things on top of it. There’s another strategy which is build assuming that OpenAI is going to stay on the same rate of trajectory and the models are going to keep getting better at the same pace… It would seem to me that 95% of the world should be betting on the latter… when we just do our fundamental job… we’re going to steamroll you.”

결국 2024년 무렵이 되자, 1세대 AI 스타트업들은 조용히 사라지는 일이 많아졌습니다. 여전히 1세대 AI 어플리케이션 형태를 갖춘 프로덕트들이 펀딩도 잘 받고 시장에 포진되어 있지만 개인적으론 매우 significant한 피봇 없이 장기적으론 어려울 것으로 전망합니다.

그럼에도 불구하고 이러한 rise and fall 사이클 속에서도, 지속가능한 새로운 세대의 2세대 AI 어플리케이션들이 모습을 드러내기 시작했습니다.

폐허 속에서: 2세대 AI 어플리케이션의 시작

1세대 어플리케이션들의 rise and fall 사이에서 이를 뒷받침하는 인프라, 프레임워크, 툴들이 크게 발전했고 더욱 complex한 프로덕트 형태를 가능케 했습니다.

LangChain이나 MCP 같은 프레임워크는 여러 모델이나 데이터베이스를 어플리케이션에 쉽게 연결할 수 있게 해 주었으며, 단순한 bi-directional 호출 이상의 복합적 아키텍처 설계가 가능해졌습니다.

CSP들도 이 분야에 적극 뛰어들면서, 복잡한 AI 어플리케이션을 구동할 수 있는 AI 클라우드 인프라가 한층 고도화되었고, Together AI 같은 인퍼런스 엔진들은 서빙 단계를 더 단순화해 주었습니다.

또한 MLOps 툴들은 프롬프트 관리, observability, evaluation 과정 등을 abstraction 해줬고 서비스 퀄리티를 한층 업그레이드 시켜 줬죠.

AI 모델의 종류가 많아졌습니다. 단순한 성능 업그레이드뿐만 아니라, AI 어플리케이션의 use case 니즈에 맞춰 크고 작은 모델, reasoning에 특화된 모델, customizing이 가능한 오픈소스 모델, 언어 지원이나 컨텍스트 윈도우가 다양한 모델 등이 등장하면서 새로운 기회가 열렸습니다.

무엇보다도, AI 모델이 점차 commoditize되면서 비용이 기하급수적으로 낮아졌고, 인디 개발자들부터 대기업 팀까지 AI 모델의 접근이 democratize 되었습니다.

이러한 툴들의 발전과 모델의 다양성 등 복합적인 시장 고도화에 따라 “누가 더 많은 자본을 끌어와서 OpenAI 크레딧을 확보하느냐”의 싸움보단, 어떻게 이 모델들과 기능들을 잘 패키징해 고객의 버티컬 니즈에 맞는 최적의 경험을 제공하느냐가 핵심으로 떠올랐다고 생각합니다.

즉, 이제는 AI 어플리케이션에 있어 “applied AI”가 중요한 경쟁 요소가 된 겁니다. 많은 사람들이 여전히 R&D를 통한 모델 개발만 집중적으로 강조하는데, 저는 applied AI 또한 매우 중요한 경쟁력이며, AI 어플리케이션의 성패를 가르는 요소라고 믿습니다.

이러한 발전들로 인해 드디어 AI 어플리케이션이 단순 “장난감”이 아니라 사람들의 생산성이나 엔터테인먼트 영역에서도 획기적인 value proposition을 제공할 수 있는 형태가 되었다고 믿습니다. AI 어플리케이션 영역에서도 어마어마한 value extraction이 가능한 시기가 됐다고 믿습니다.

성공한 2세대 AI 어플리케이션의 특징

이러한 전반적 발전이 2세대 AI 어플리케이션의 문을 활짝 열어주었습니다. 2세대 어플리케이션은 1세대처럼 파운데이션 모델이 전면에 나서기보다, back seat에서 역할을 하고, 사용자는 제품 경험 중심으로 서비스를 이용하게 됩니다.

이렇게 등장한 2세대 AI 어플리케이션 중에는 빠른 성장을 넘어 지속 가능성까지 보여주는 곳들이 생겼습니다. 예를 들면 많은 분들이 알고 계시는 AI 리서치 에이전트 Manus AI, 코딩 에이전트 Lovable, AI companion Replika, 사진 편집 툴 PhotoRoom 등이 그러한 예시입니다.

물론 AI 어플리케이션 자체가 아직 완전히 성숙한 시장은 아니므로, 이들이 앞으로도 잘 해내갈 수 있을지 단언하기는 이릅니다. 하지만 적어도 1세대처럼 갑자기 사라질 서비스들은 아니라는 점에는 상당히 동의하실 것입니다.

이들은 오로지 foundation model 콜만 던져주는 단순 래퍼(wrapper)가 아니라, 자신만의 고객 페인포인트와 워크플로우를 깊이 이해하고 이를 프로덕트에 다양한 형태로 녹여냈기 때문입니다. 이러한 노하우를 반영하기 위해 내부적으로는 매우 복잡한 아키텍처와 UI/UX가 짜여 있지만, 유저 입장에서는 간편하고 seamless하게 느껴지도록 설계되어 있습니다.

물론 자체 모델을 학습하는 경우도 많지만, 그게 가장 중요한 성공 요소는 아니라는 거죠. 게다가 모델 성능이 좋아질수록 이 앱들이 obsolete 되기는커녕 오히려 더 강력해질 수 있도록 포지셔닝을 취하고 있습니다.

이러한 2세대 AI 어플리케이션들까지 “GPT-Wrapper”라고 비아냥하기엔 무리가 있다고 봅니다.

2세대 AI 어플리케이션 역시 여전히 네트워크 효과나 높은 switching cost를 갖추었다고 보긴 어렵습니다.

그럼에도 이들은 유저가 기꺼이 돈을 낼 만큼 좋은 프로덕트를 만들었고, 이로 인해 매출이 성장하면서 새로운 경쟁자나 후발 주자 대비 자본 조달비용(cost of capital)을 크게 낮추는 데 성공했습니다.

예컨대, 유저가 부담 없이 프로덕트의 value proposition을 체험할 수 있도록 무료 버전을 폭 넓게 제공할 수도 있고, 우수 인재를 영입하고, 사용자의 피드백과 사용 행태를 분석해 프로덕트를 누구보다 빠르게 고도화할 수 있습니다.

따라서 제가 보는 2세대 AI 어플리케이션이 가진 주된 장기적 moat는 아래와 같은 flywheel effect를 돌려 누구보다 빠른 “execution speed”을 유지하는 것이라고 생각합니다.

💡

Amazing product —> Viral growth —> Gather feedback and iterate —> Low or near $0 CAC —> High monetizability —> Low cost of capital —> Attract top talent —> Repeat

성공한 2세대 AI 어플리케이션들을 살펴보면 공통적으로 나타나는 특징들이 있습니다. 물론 모든 케이스에 100% 들어맞지는 않겠지만, 투자자 입장에서 2세대 AI 어플리케이션을 초기에 미리 파악하는 데 꽤 도움이 될 것 같아 정리해 봅니다. 분명 예외는 있겠지만, rule of thumb 정도로 봐주시면 좋겠습니다.

Niche Focus

성공한 AI 어플리케이션들은 결코 general-purpose 하지 않습니다 (trying to be everything to everyone). 오히려 많은 타겟 잠정 유저들을 포기하더라도 더 상세한 워크플로우, 용도, 취향을 공략해 그 소수 고객에게 엄청난 만족감을 주는 전략을 택합니다. Character AI가 좀 더 범용적(general purpose)이라면, 명확한 전략을 세운 Replika가 niche를 타겟한 좋은 예시가 될 수 있을 것 같습니다.

Product-Led Growth

“If you are doing marketing, you are doing something wrong.” 성공한 2세대 어플리케이션들은 초창기에 마케팅비를 투입하지 않았습니다. 위에서 다룬 바와 같이 AI 어플리케이션 시장은 네트워크 효과도 없고, 전환 비용도 거의 없으므로 마케팅으로 사용자를 유치하는 건 밑 빠진 독에 물 붓기라고 생각합니다. 조바심에 마케팅비부터 쓰는 건 극도로 경계해야 합니다. 궁극적으로 CAC(고객획득비용)을 낮추는 가장 확실한 방법은 정말 좋은 제품을 만들어 WoM으로 성장하는 것이라고 생각합니다.

Monetization

성공한 2세대 AI 어플리케이션들은 대부분 초기부터 과감히 유료화를 시도합니다. 창업자 입장에서는 모멘텀이 좋은 상황에서 과금을 시작하면 유저가 떠나진 않을까, 경쟁사에게 뒤처지진 않을까 등 여러 걱정이 생길 수밖에 없죠. 팀 사기나 투자자 기대치도 생각하게 되고요. 하지만 지속 가능한 비즈니스를 증명하는 유일한 방법은 결국 유료화고, 이것이야말로 프로덕트가 진짜 PMF(Product-Market Fit)를 갖추었는지, 경쟁력이 있는지를 확인할 가장 확실한 척도이고 현실을 직시해야 합니다. 마케팅 투자를 하지 않았다 하더라도 모델 인퍼런스 비용과 서버 비용은 결국 스타트업이 감당해야 할 CAC입니다. 시장에는 “good enough” 공짜 서비스들이 계속 등장하기 때문에, 소비자는 결국 돈을 낼 가치가 있는 제품에만 남는다는 걸 잊어선 안 됩니다.

Growth of growth

VC들이라면 다들 성장에 관심이 많습니다. 근데 AI 어플리케이션 시장에선 1차 미분(성장률) 뿐만 아니라 2차 미분(성장률의 성장률) 또한 재미있는 지표라고 생각됩니다. 매일 수백 개의 새로운 팀이 등장해 같은 버티컬 시장을 공략할 때, 가장 성공한 회사들은 경쟁자들의 추격을 허용하지 않을 정도로 성장 속도 가속이 훨씬 빨랐습니다. 이는 일찍부터 정교한 피드백과 실행력을 기반으로, 특정 니치에 집중해 제품력을 더욱 높이고, 그 결과 바이럴 기반의 제품 주도 성장을 만들어냈기 때문이라고 생각합니다.

Conclusion

AI 시장은 그 어느 산업만큼 역동적이고 예측하기 어렵습니다. 그렇기 때문에 더욱 흥미진진한 것 같습니다. 이 시장을 지켜보는 한 투자자로서, 지금까지의 성공한 AI 어플리케이션과 그렇지 못한 사례들을 전략 관점에서 제 나름대로 정리해 보았습니다.

많은 1세대 어플리케이션 창업자들께서 하신 노력과 시도를 모두 싸잡아 폄하하고 싶은 마음은 전혀 없습니다. 저야말로 스크린 뒤에 숨어 탁상공론을 하고 있을 뿐이고, 실제로 현실에서 실행해보며 시행착오를 겪은 창업자분들은 그 자체로 엄청난 도전을 했다고 생각합니다. 시장을 지켜보는 한 사람의 의견과 분석이라고 생각해주시면 감사하겠습니다.

Jason 블로그 구독하기