[오픈채팅방 Archive] jasonlee snippets

https://open.kakao.com/o/g54STvyg

Jul 09, 2024

Contents

AI Companionship이 외로움의 본질을 해결할 수 있는가 구글 제미나이의 추격 오픈AI, Windsurf 인수하는 이유 퍼플렉시티 재정난 의혹?AI 어플리케이션 - 챗 인터페이스에서 새로운 경험으로 벤처 생태계 내 신기한 리스크 관점 무어의 법칙처럼 AI 에이전트가 수행할 수 있는 업무의 길이 (therefore, complexity)는 7개월 마다 2배 증가한다.알파고 글에 대한 피드백 새로운 오픈소스 추론 강자 - 알리바바 Qwen 모델 오픈AI 2024년 손익계산서 YC가 공유했다가 욕 먹고 삭제한 데모영상 경쟁사의 트래픽을 뺏어와보자 (feat. inpages)딥시크 DAU 및 다운로드 수 폭발 24Q4 기준 미국 유니콘 세컨더리 수요 리더보드 모델의 인퍼런스 비용은 기하급수적으로 내려간다 딥시크 - 정말 GPU는 더 이상 필요없는 것인가?벤처는 어렵다!LLM OS - 새로운 컴퓨팅 패러다임 Big 3 외 AI회사들은 설 자리가 없다 AI가 의사들보다 진단을 잘할까?자타공인 가장 핫한 AI 스타트업 Cursor가 이탈한 고객의 목소리를 듣는 방법 구글이 돌아왔다. Gemini 모델의 반란 스케일링 법칙: 이젠 Pre-Training이 아니라 모델에게 “생각할 시간”을 준다 Waymo의 역전: Ride-hailing 산업 내 지각변동?책 같이 읽어주는 AI 친구: 내가 절실히 필요한 AI 프로덕트 스포티파이는 어떻게 $100B 회사가 되었을까?달리는 xAI와 Elon Musk 주택담보대출 이후 새로운 증권 - “AI 반도체 담보 대출”AI 파운데이션 모델은 역사적으로 가장 빠른 감가상각을 받는 자산 Anthropic이 돌아왔다! Claude Computer Use 스트리밍 전쟁: 압도적 1위 넷플릭스 SaaS: Lifetime Value가 다시 중요해졌다 엔비디아가 강력한 이유 AI 반도체 위너는 누가 될까? 리서치 페이퍼 기반 선행지표!AI 어플리케이션의 차별 포인트는 GTM?벤처펀드 아포칼립스 오픈소스 코드 에디터 - Pear AI The Intelligence Age 오픈AI 보이스 모드 드디어 출시 워렌 버핏의 주식투자 철학 에듀테크 사업이 어려운 이유 Collison Installation LLM 벤치마크 테스트를 cheating하는 방법 1 Billion MAU 컨슈머 어플은 끝났다; 버티컬 어플 전성시대 Founder Mode (feat. Paul Graham)GPT-3 —> GPT-4 급 퀀텀점프가 온다. 오픈AI 일본 대표의 예견 고수의 생각법 (feat. g.nyuk)Just do it Hype cycle을 따라가지 말고 주도하라 디퓨전 모델이 게임엔진을 대체한다?AI 여자친구보다 AI 남자친구가 시장기회가 더 크다 도메인 경험/지식: 스타트업에게 필수적인가?Keith Rabois가 창업자에게: 런웨이 말고 “lift”에 신경써라 우버가 콜드 스타트 문제(cold start problem)을 해결한 방법 2024년 1분기 벤처투자 펀드 실적 현황은?엔화 캐리 트레이드: 주식시장 폭락 이유 이해 Rabbit, Humane 폭파 이후 새로 나온 AI Pin 회사: Friend Screw WFH - 사무실 근처로 이사를 독려해라 (Peter Thiel)주식의 본질: Food for Thought from Stan Druckenmiller 😡개빡침주의: 두산로보틱스 x 두산합병 - 슈카형이 얘기하는 국내 자본시장의 문제 $6B 투자받은 일론 머스크의 xAI; 테슬라가 추가 $5B 투입 암시?Llama-3.1 405B 모델 공개!왜 Meta는 자기 모델을 오픈소스할까?실리콘밸리 “슈퍼 베이비”의 시작 - 출산테크(Fertility Tech)의 약진 AI의 붉은 여왕 가설 - Red Queen Effect (2024-07-16) 돈나무 언니의 AI 친구 리포트 (2024-07-12)트렌드라인을 믿어라 - 2027년 AGI는 온다: 소베린 AI를 고민할 시기 (2024-07-11)AI 쇼핑 에이전트 프로덕트! (2024-07-09)오픈소스 리더보드 업스테이지 퍼포먼스 논의 (2024-07-08)💡 Inspiration of the Day: 🤯 Absolutely Bonkers AI Avatar Product for Creators! 🎨🚀 (2024-07-04)Meta’s New Text-to-3D Generator Creates 3D Models in Under a Minute (2024-07-03)My Views on Generative AI Landscape (2024-07-02)1. Where will the opportunities arise in Gen AI?2. Is AI a hype?3. Where should we invest?Hugging Face releases harder, faster, stronger open-source leaderboard (2024-07-01)Why Leaderboards are Important Problem with Leaderboard v1 Leaderboard v2 Exponential rise of training costs for LLMs. Is it sustainable? (2024-06-28)Rippling Memo 2019 (2024-06-26)Problem Statement: Company Strategy:Product What it takes to be valued at >10x Rev (2024-06-25)OpenAI acquires Rockset (2024-06-24)End of Software (2024-06-23)Forget about LTV/CAC; IRR on CAC is all you need (2024-06-22)

💡

스타트업 종사자 및 벤처투자자들을 위해 작은 오픈채팅방(<200)을 개설했습니다. 단순 뉴스클립이 아니라 깊은 공부와 고민이 필요한 주제에 대해 다뤄볼 예정입니다. *익명 참여 가능, 광고 X, 스팸 X 카톡방 링크: jasonlee snippets 오픈채팅방 PW: 0852 내용 예시: Archive 링크

AI Companionship이 외로움의 본질을 해결할 수 있는가

블로그에서도 언급했듯, 현재 생성형 AI의 가장 보편적이고 인기 있는 활용 분야는 단연 "companionship"입니다. 이 분야에서는 생성형 AI의 대표적인 한계로 지적되는 "환각(hallucination)" 현상조차도 오히려 "버그"가 아니라 "기능"처럼 작용하기 때문에 "lowest hanging fruit"입니다. 실제로 2025년 AI 활용도 조사에서도 Therapy/Companionship 분야가 가장 높은 비율을 기록했죠.

여기에 더해, "외로움"이라는 감정 자체가 거시적인 차원에서 점점 더 보편화되는 추세인 것도 이 분야의 성장을 뒷받침하고 있습니다. 만약 생성형 AI가 외로움 문제를 실질적으로 "해결"할 수 있다면, 아래의 구글 검색 트렌드처럼 외로움 관련 키워드의 검색량은 감소하게 될까요? 아니면 생성형 AI는 단지 일시적인 방파제 역할에 그칠 뿐, 외로움이라는 인간의 본질적인 문제를 근본적으로 해결할 수는 없는 걸까요?

구글 제미나이의 추격

구글이 어마어마한 속도로 조용히(?) 오픈AI를 추격하고 있습니다. Gemini 2.5 Pro가 o3 대비 동등한 성능을 보이면서 압도적인 가격우위를 보여주고 있죠. 그럼에도 불구하고 ChatGPT와 Gemini의 사용자 지표는 점점 멀어지고 있습니다. 구글이 깨어난 지금, 이 격차가 줄어들까요? 아님, 정작 어플리케이션 영역에선 약간의 "모델 성능" 우위보다 결국 다른 것(UI, 브랜드 등)이 더 중요한 것일까요?

오픈AI, Windsurf 인수하는 이유

아래는 Altimeter Capital의 Jamin Ball 글에서 발췌

OpenAI가 약 30억 달러에 Windsurf(Codeium) 인수를 추진 중

OpenAI·Anthropic 등 모델 연구소들은 자체 “SWE Agent”, Claude Code 등을 선보이며 애플리케이션 영역으로 진출 중

모델 API 가격이 commoditize될수록, 모델 기반 앱이 더 높은 마진과 견고한 수익원을 제공

Frontier research lab들이 최신 모델을 자사 앱에만 쓰고 API에는 하위 레벨 버전을 제공할 위험이 제기됨 (현재는 최신 모델도 API로 공개하지만, 방향이 바뀔 수 있음). 다만, 여러 프론티어 리서치랩들과 오픈소스 모델들이 서로 견줄만한 모델 퍼포먼스를 보여주는 지금, 단기적으론 어려울 것으로 개인적으로 봄. 먼 미래에 하나의 압도적인 승리자가 생기면 위험 고도화.

앱 사용으로 생성되는 풍부하고 독점적인 사용자 데이터(예: RLHF용 ChatGPT 대화, 코딩 자동완성 선택)는 모델 훈련 품질을 크게 높임

데이터 확보로 사용할 수 있는 자체 앱이 없으면 매우 비싼 Scale AI, Mercor 같은 라벨링 업체에 의존해야 하므로, 인기 많은 애플리케이션을 보유함으로써 비용 절감과 지속적 데이터 우위를 가져옴

단기 수익뿐 아니라 방대한 실사용 코드 피드백을 확보해 코딩 모델 경쟁력을 강화하고 진입 장벽 구축

모델 기업들이 도메인별 데이터·수익 확보를 위해 추가적인 애플리케이션 인수나 출시를 이어갈 가능성이 크다. 바이오·법률·헬스케어 등 공개 데이터가 부족한 분야에서도 “자체 앱을 통한 데이터 확보” 전략은 동일하게 적용될 것

퍼플렉시티 재정난 의혹?

Reddit 누군가가 퍼플렉시티가 금전적인 어려움을 겪고 있다고 의혹 제기함

1) Perplexity에서 캠퍼스 전략가로 일하는 내부자로부터 마케팅과 파트너십에 대한 모든 자금 지원이 중단되었다는 정보를 들음. Perplexity 교육 사이트에서 "신청 양식"이 오프라인 상태인 것을 확인할 수 있음.

2) Perplexity는 이제 사용자가 이전에 선택한 모델 대신 모든 후속 질문을 “Auto” 응답으로 전환함. 게다가 o1과 같은 고품질 모델도 사라짐. 이는 비용 절감으로 보임.

3) 서버 인프라 변경. 확실하지 않지만, 업로드한 파일을 확인하면 더 이상 모두 AWS로 가지 않는 것을 발견함. 추측컨대, 더 저렴한 서버 네트워크로 전환하면서 웹사이트와 라이브러리의 오류가 발생하는 것으로 보임.

4) 해고. 여러 직원의 LinkedIn을 확인해보니 회사를 떠나거나 해고된 것으로 보임. 스타트업에서 흔한 일이지만, 예산 가용성이나 직원들의 신뢰도 면에서 좋은 신호는 아님.

아래는 Perplexity 대표 Aravind Srinivas가 Reddit에서 즉각 반박한 내용:

오토 모드 도입: 사용자 경험을 단순화하기 위해 AI가 최적의 처리 방식을 자동 선택하도록 설계. 비용 절감이 아닌 제품 개선이 목표.

인프라 및 안정성: 강력한 Deep Research (Manus처럼 30분 동안 고민하는 에이전트) 지원을 위한 인프라 업그레이드 중으로, 안정성을 우선시하며 일시적 오류 해결에 집중.

후속 질문 개선: 후속 질문이 Auto로 전환되던 문제를 사용자 피드백 반영해 Pro, Reasoning 모드를 유지하도록 조정 예정.

GPT-4.5 제외: 속도(11 토큰/초)가 느려 사용자 경험에 부정적이라 성능 개선 전까지 제외.

UI 품질: 빠른 개발로 인한 버그를 인정하고, 안정성 강화를 위한 프로세스 도입 중.

AI 어플리케이션 - 챗 인터페이스에서 새로운 경험으로

아래 글에 100% 동의; 대부분의 생성형 AI 기반 어플리케이션은 챗 인터페이스로 되어 있는데 뭔가 부족하고 unimaginative한 느낌..

현재 단순 챗 인터페이스에서 아예 새로운 경험으로 transformation하는 어플리케이션이 사람들에게 매우 높은 호응을 끌고 있음 (e.g. Cursor, Tolan, Status 등)

벤처 생태계 내 신기한 리스크 관점

VC 씬 내 메가펀드는 초기 단계의 고위험/고수익 투자에서 벗어나 절대 수익을 극대화하기 위해 더 광범위하고 후기 단계 전략으로 전환하며 "재위험화(re-risking)"를 실행하고 있음 (de-risking과 반대됨)

언뜻 보면 리스크 관점에서 Series D가 Series A보다 안전해야 하고, Series A가 Pre-seed 단계의 회사보다 안전한 회사여야 한다. 시간이 갈수록 회사는 비즈니스 모델을 증명하고, 탄탄한 고객군을 확보하면서 PMF를 증명했기 때문.

때문에 회사의 성장 life cycle의 후단에 가면 갈 수록 회사가 많은 리스크와 불확실성이 해소되었음으로 low-risk, low-return 프로필이 된다… 라고 책에서 배웠다.

하지만 최근 벤처는 회사 life cycle의 후단에 큰 금액을 투자함으로써 회사를 “re-risking”하여 더 큰 리스크를 감수하고 더 큰 리턴을 포폴사로부터 원하고 있음. 그로쓰 단계 투자를 low-risk, low return 프로필을 high-risk, high-return으로 re-risking한 것.

최근 국내에선 소수 펀드들에게 자본이 집중되면서, 이 펀드들은 거대한 펀드규모를 정당화하기 위해 10억 투자금액을 10군데 찾느니, 차라리 한 군데에 100억+ 금액을 투자하는 것을 선호하고 있음. 미국은 더 함.

리턴 멀티플(10x > 2x ROIC)보다 절대적 리턴을 중요시하게 되며, Power Law에 따라 소수의 업체들에 자본이 집중됨. 하지만 거대한 자본유치를 한 소수의 업체들에게도 이 상황이 마냥 긍정적인 것일까? 선택된 회사는 de-risking 된 회사를 이어받는 것이 아니라 거대한 자본을 받았던 시점부터 다시 re-risking됨으로써 편할 날이 없을 것 같다.

Not saying it’s purely bad - the team should understand what they’re getting themselves into.

무어의 법칙처럼 AI 에이전트가 수행할 수 있는 업무의 길이 (therefore, complexity)는 7개월 마다 2배 증가한다.

Source: ‣

알파고 글에 대한 피드백

제 블로그에 대해 어떤 분이 본인 생각을 올려주셨습니다. Critique과 관심에 대단히 감사하며, 주신 피드백에 대해 제 생각을 정리해봤습니다. 더 많은 피드백 부탁드립니다!

Source: https://blog.naver.com/neo_turing/223786125959

1. 알고리즘 혁신 없이 scaling law는 성립할 수 없다

독자께서 말씀하신 것처럼 scaling law가 강화학습(RL)이나 attention 메커니즘 같은 알고리즘 혁신의 뒷받침이 필수적이란 것에 대해 전적으로 공감합니다. 제가 지적하고 싶었던 점은 연구자들이 자신들의 세계관, 또는 이해력으로 bias를 알고리즘에 주입할 때 모델학습이 망가진 다는 점입니다. 모델을 더욱 효율적이고 똑똑하게 만드는 scalable 방식의 알고리즘 (e.g. backprop, RL 등)은 계속 개발되어야 할 것입니다.

다만, 중요도를 굳이 따져본다면, AGI를 더 빨리 달성하기 위해 단 하나의 lever를 사용해야 한다는 가정 하엔 알고리즘의 혁신보다 단순 scaling이 더 효과적(therefore, more monumental)일 것으로 봅니다. 왜냐하면, 알고리즘은 discovery 문제 (R&D)인 반면, scaling은 단순 엔지니어링 문제이기 때문입니다. 또한, 트랜스포머 아키텍처는 2017년 세상에 나온 이후 오늘 날까지 크게 변하지 않았다는 점도 참고할만 합니다.

더 많은 연산규모를 동원했을 때 결과가 그 전보다 더 나쁠 수는 없음

전적으로 동의합니다. Scaling law는 지적해주신데로 더 많은 컴퓨팅 파워/데이터/파라미터 수를 사용 시 예측가능한 수준으로 성능이 올라온다는 것이며 끝은 아무도 모른다는 뜻입니다.

이 가설이라면 scaling law에 따라 인간을 훨씬 뛰어넘는 AGI/ASI를 만들 수도 있죠. 리딩 AI랩들은 scaling law가 죽는 것(”pre-training has hit a wall!”)보다 현재로썬 “에너지” 및 “컴퓨팅 파워”가 바틀넥으로 보고 있습니다.

Scaling law의 맹목적 믿음이 게으름을 만들 수 있다

꼭 그렇지 않다고 봅니다. 여전히 할 일은 산더미입니다. 1) 효율화를 위해 알고리즘 혁신이 필요하고, 2) 단순히 똑똑한 모델을 만들 것이 아니라 소비자들이 사용하기 쉽게 API, UI 등이 개선되어야 할 것이고, 3) 더 큰 모델을 학습하고 안정적으로 효율적으로 서빙할 수 있도록 여러 엔지니어링 챌린지가 남아있습니다.

딥시크의 R1은 매우 놀라운 연구성과 사례이긴 하지만 큰 모델은 여전히 존재할 것입니다. 더 많은 인텔리전스를 작은 모델에 squeeze-in 한다면, 그 배움을 토대로 더 큰 모델을 만든다면 더욱 높은 인텔리전스를 보유하게 될 것 입니다.

Scaling law 강조가 인간 지능 이해와 멀어지게 할 수 있다

블로그 글에서도 얘기했듯이 인간의 지능과 인공지능을 꼭 연계해서 이해하거나 연구할 필요가 없다고 생각합니다. Richard Sutton도 얘기했듯이 이 2개의 학문을 섞으려다 보니 AI 개발이 지체되는 것으로 보여집니다.

인간의 뇌에 대한 이해를 AI 개발과정에 주입시키려고 하지 말고, “Bitter lesson”을 받아들여야 된다고 생각합니다.

새로운 오픈소스 추론 강자 - 알리바바 Qwen 모델

32B으로 DeepSeek R1보다 20배 작은 사이즈면서도 비슷하거나 우월한 성능

R1은 MoE이고 QWQ-32B은 dense model이어서 인퍼런스 때 사용되는 파라미터 수는 비슷하겠지만, 그래도 엄청난 빠른 속도와 연구개발 능력을 보여줌

오픈AI 2024년 손익계산서

오픈AI 전체 매출은 $4B; 매출총이익률을 단순 계산 (Rev - MSFT rev share - Compute to run Models - hosting, other cost of sales) 하면 약 22.5%(GM $0.9B) 밖에 안됌; 직접비가 매출의 77.5%!

R&D를 또 별도로 빼 놓으면 오픈AI가 선두주자 지위를 유지하기 위해 사용하는 투자금액은 약 $4.85B (Compute to train models + Research Compute Amortization + Data + 50% 가정 of employee salaries)

요약하자면 직접비 빼고 OpenAI가 버는 돈은 약 $900M 수준임. 22.5% 수준의 매출총이익률이라도 벌 수 있는 이유는 OpenAI가 first mover의 장점과 최고 frontier 모델을 지속적으로 유지할 수 있기 때문임

하여 $4.85B의 R&D 비용이 직접비로는 들어가진 않지만 오픈AI가 pricing power를 유지하려면 필수적인 spend이기 때문에 실제 총이익률은 더 낮게 잡아야 될 수도 있음

추가 약 $1.05B은 SG&A 관련 비용 (이 중 사실 일정 부분은 직접비로 봐야할 수도 있긴 함)

여전히 OpenAI에 대한 투자수요는 높음. OpenAI가 최고 선두주자이고, 오픈AI 외 이 거대한 시장에서 경쟁하는 플레이어는 얼마 남지 않았음 (Anthropic과 xAI 정도)

결국에 미래엔 돈을 벌어야 할텐데 어떻게 돈을 벌까? 내 생각은 가격을 올리지는 못할 것 (적어도 중단기적으론)

너무 비싸면 불편함을 감수하더라도 오픈소스 모델들로 대체할 수도 있고, 경쟁사들이 사용자를 뺏어오기 위해 모델 비용을 subsidize하고 있기 때문. R&D나 SG&A를 쉽게 감액하지도 못함. Frontier 수준을 유지해야 pricing power를 유지하기 때문.

그렇다면 결국 엄청난 compute scale과 효율화를 통해 직접비를 획기적으로 줄이는 방안을 택할 것 —> 스타트업, 개인들, 엔비디아한텐 긍정적!

YC가 공유했다가 욕 먹고 삭제한 데모영상

Optifye (YC W25) AI for Sweatshops 회사 (비전 및 LLM으로 작업장 모니터링 소프트웨어)

There is no such thing as bad publicity라고 하지만 너무 많은 사람들한테 거부감(Big Brother)을 느끼게 함

투자자로써 감정적인 면은 둘째 치고, 회사의 비전과 가치제안을 느끼게 해줄 수 있지 않았을까?

예를 들어, 데모영상을 일을 잘하지 못하는 노동자를 감시하고 채찍질하는 것보다 항상 열심히 하고 효율이 좋은 노동자가 회사 내 정치 때문에 보상이나 승진기회를 놓치는 것을 보완하는 소프트웨어라던지 등..

경쟁사의 트래픽을 뺏어와보자 (feat. inpages)

프로덕트 완성도가 어느 정도 궤도에 올라오면, 마케팅 집행을 통해 알맞는 잠재 고객 앞에 우리 제품을 세일즈 해야합니다.

많은 회사들이 사용하는 방법이 구글 키워드 검색 광고입니다.

다른 마케팅 방식(틱톡, 블로그, 인스타 광고 등)과 달리 검색광고는 엄청난 창의력이 요구되는 캠페인이 아닙니다. “어떤 키워드가 내 타겟 고객군을 뾰족하게 공략하여 트래픽 대비 컨버젼을 가장 많이 일으킬 수 있을까?” 등 전략적, 게임이론적 고민을 해야 되는 판이죠.

최근 inblog팀이 inpages라는 프로덕트를 내놓았습니다. 이 플랫폼을 통해 “내 경쟁사는 어떤 키워드 광고를 통해 얼마 수준의 트래픽과 마케팅 비용을 집행하고 있을까?”를 알 수 있습니다. inpages를 사용한다면 바퀴를 재발명할 필요 없이, 검색광고 전략 구성에 큰 도움이 됩니다.

예시로 국내 AI 컨슈머 어플리케이션 트래픽 기준 1등 뤼튼을 찾아봤습니다. 제가 B2C 챗봇을 만들고 있는 창업가라면 뤼튼은 광고집행을 어떻게 하고 있을지 궁금할 것입니다.

사진1을 참고하시면 뤼튼이 집행하고 있는 모든 검색광고 캠페인 수, 예상 월 트래픽과 월 비용이 나타납니다. 뤼튼은 평균적으로 검색광고 유입 트래픽 당 $0.22를 지불하고 있네요.

또한, 각 SERP의 키워드를 클릭하시면 어떤 키워드를 사용하는지 볼 수 있습니다. 재밌는 캠페인 중 하나가 “챗 gpt 대체”를 키워드 광고로도 사용하고 있네요. 챗GPT에 실망한 고객이 대체제를 찾으려고 구글에 서칭을 해보고 자연스럽게 뤼튼에 유인하기 위함입니다.

뿐만 아니라 organic 컨텐츠론 뤼튼이 어떤 키워드로 SEO를 하고 있으며 효과는 어떤지, 어떤 키워드가 뤼튼(또는 내 프로덕트)에 가장 잘 먹히는지 알 수 있습니다. 아래 링크에서 무료로 사용해볼 수 있으니 확인해보세요!

inpages | Competitive Analysis

딥시크 DAU 및 다운로드 수 폭발

딥시크 DAU는 현재 ChatGPT의 23% 수준(!); 다운로드 수는 훨씬 압도

바이럴로 인한 반짝 인기일까, 아님 지속가능한 트렌드일까?

Probably the former

24Q4 기준 미국 유니콘 세컨더리 수요 리더보드

어떤 산업과 스타트업이 현재 핫한지 보여주는 시그널 중 하나

SpaceX는 6분기 동안 연속 1등, 국방 스타트업 Anduril 2등, 결제 플랫폼 Stripe 3등

큰 움직임들을 살펴보면 Bytedance/TikTok (+12), Coreweave (+11), Kraken (+11), Deel (NEW), Rippling (-11), Ripple (NEW) 등

랭킹을 이해하고자 한다면, 몇 가지 가설은:

SpaceX, Neuralink, xAI 등 Muskonomy 회사들은 트럼프 당선 이후 수요가 높아진 것?

크립토 회사(Kraken, Ripple)들 back in vogue?

CoreWeave - neocloud 업체들 사이 consolidation / 위너가 나타난 것일까? 아님, 고성능 데이터센터 수요 급증에 따라 모든 업체들 관심도 상승?

Q4엔 틱톡 밴 리스크가 있었을텐데 왜 랭킹이 올랐을까? 11월 경 announced 된 buyback program 덕분?

SaaS 회사(Deel, Rippling)은 산업이나 매크로 움직임보단 micro (회사-specific)한 이슈로 관심도가 달라졌을 것으로 예상; Deel은 여전히 어마무시한 그로쓰를 보이고 있고, Rippling은 조용

모델의 인퍼런스 비용은 기하급수적으로 내려간다

3년 전만 해도 GPT-3 인퍼런스 비용(per 1M 토큰)은 $100 가까이 됨; 이젠 거의 1,000~10,000배 수준으로 비용이 내려옴

GPT-4가 처음 론칭했을 땐 $60; 현재는 $2 수준까지 내려옴

이는 하드웨어 혁신(more powerful, efficient GPUs per $)과 알고리즘적 혁신으로 가능함

Non-frontier 모델들의 인퍼런스 비용은 계속 기하급수적으로 내려갈 것이며, 이 트렌드가 지속될 시 현재 시점의 frontier 모델들 (sonnet, o3 등) 또한 가격이 몇 십원 수준으로 떨어질 것으로 예상됨. 다만, 그 때 쯤 되면 새로운 frontier 모델이 높은 가격을 부르고 있을 것

Jevon's Paradox란 원료 사용 효율을 높이는 기술 혁신이 오히려 원료의 사용을 촉진한다는 관찰 (예를 들어, 에너지, 플라스틱, 배터리 등 가격이 내려가면 내려갈 수록 오히려 사용량이 기하급수적으로 늘어나는 경제학적 현상)

AI의 사용가격이 낮아짐에 따라 오히려 더욱 AI 사용량이 proliferate할 것이며 우리 삶 곳곳에 침투하게 될 것이고, frontier lab들은 더욱 똑똑한 시스템을 만들기 위해 CapEx와 R&D를 계속해서 늘려나갈 것. 이에 기하급수적으로 증가하는 사용량, 모델의 다양성, 스케일링 법칙에 따라 더욱 큰 모델을 위해 더 많은 데이터센터와 에너지원이 필요할 것으로 전망

딥시크 - 정말 GPU는 더 이상 필요없는 것인가?

SemiAnalysis의 분석에 따르면 딥시크의 전체 서버 CapEx (약 50,000 hopper GPU + 10,000 H100)는 $1.3B, 총 TCO (4년 운영 가정)는 약 $2B(!)

Andrej Karpathy 등 많은 AI 전문가들은 딥시크가 $6M 수준으로 v3을 학습했다는 것은 $5M 숫자는 최종 모델 학습에만 사용한 것일 것이라고 추정; 더 적합한 apples-to-apples 비교를 위해선 o1이나 o3에 사용된 총 GPU hours가 아니라 마지막 프로덕트에 사용된 것만 발라내고 비교해야 할 것

딥시크의 성과를 저평가하는 것은 아님; 당연히 알고리즘(RL)적 혁신이 있었다는 것은 분명하지만 시장의 반응은 over-reaction처럼 보임

AI 시장 계속 팔로업하고 있는 사람들은 이미 딥시크에 대해 알고 있었음; 갑자기 시장에서 오바하는 것처럼 느껴짐; 이 것 때문에 스케일링 법칙이 끊겼다라고 얘기하지만 전혀 그렇지 않음. 오히려 reinforce 하였음 (사진2 참조)

벤처는 어렵다!

거대 FoF인 Cambridge Associates에서 발표하는 펀드 퍼포먼스 리포트입니다..

최근 Q3 2024 자료가 나왔는데 암울하네요..

특히, 이제 펀드설립으로부터 9~10년 된 펀드, 즉 만기가 도래하는 펀드들의 DPI가 완전 침체입니다.. 벤처투자는 정말 어려운 것 같습니다

2015 Vintage Funds DPI Median Fund: 0.49x Upper Q Threshold: 1.13x Top 5% Threshold: 2.66x

벤처펀드의 퍼포먼스를 분석할 땐 무엇보다 DPI가 가장 중요한 수치입니다. TVPI 등 다른 지표는 자체 마크업하고 회계처리한 밸류 때문에 각 펀드마다 너무 상이하고, 결국 "투자자들에게 얼마나 돈을 많이 돌려주었느냐"만이 객관적인 지표입니다

탑 25%가 겨우 원금상환(1.13x)했고, 중간값이 0.49x (즉, 투자한 돈의 반도 못 돌려줌)!

LLM OS - 새로운 컴퓨팅 패러다임

멀티모덜 모델들이 탄생하면서 사람들은 우리가 컴퓨터와 상호작용 하는 방식이 근본적으로 바뀔 것으로 생각하고 있다.

오래 되긴 했지만 아래는 Andrej Karpathy가 상상한 LLM OS의 도표임

마우스와 키보드로 컴퓨터와 상호작용했던, PC 시대 이후 계속 지속 되어왔던 이 Graphic User Interface에서 벗어나 미래엔 우리는 LLM OS로 컴퓨터와 대화할 것임

LLM이 중간에 배치 되어있고, 우리는 보이스, 또는 비디오를 통해 감정과 의도를 커뮤니케이션함.

이 LLM은 필요에 따라 tool use (인터넷, 계산기 등), 파일 시스템 (vector embeddings), 다른 LLM과 상호작용하여 나의 직접적인 개입 없이 에이전트 형식으로 점점 진화할 것으로 생각됨

재밌는 thought experiment는 이 미래가 올 것이란 것을 가정하면, 현재 기술에서 어떤 기술들이 갖추어야 이 미래에 도달 할 수 있을까?

Big 3 외 AI회사들은 설 자리가 없다

오픈AI, Anthropic, xAI 등과 같은 회사들은 현재 시장에서 몇 조 단위의 돈을 끌어 모을 수 있다. 다른 회사들보다 압도적으로 낮은 cost of capital을 갖고 있다.

2nd tier 회사들 (Mistral, Cohere, Stability 등)은 뒤쳐지고 있음. 스케일링 법칙에 따라 지속적인 컴퓨팅 자원을 투입하지 못하다 보니 모델 학습이나 배포에도 속도가 느려지고 있고, 인재들은 Big 3에 집중되고 있음

이 거대 회사들 외에 AI 파운데이션 모델 회사들은 설 자리가 없다고 생각함. Inflection, Adept 등에 이어 운 좋으면 acqui-hire가 되던지, 아님 결국 모델회사가 아니라 system integrator 같은 역할을 맡지 않을까 싶다.

Tier 2~N 모델 회사들은 자신의 경쟁사와 Peer가 오픈AI, Anthropic, xAI라고 얘기하고 다닐 것이다. 이러한 프레이밍이 멀티플 측면이나 인재유치 측면에서나 자신들에게 더 도움 되니까 말이다.

하지만, 이 들의 진짜 경쟁사는 공짜로 이러한 모델들을 배포하는 오픈소스 이코시스템 (Hugging Face, Nvidia 등)이다. 오픈소스가 이 들을 잡아먹을 것으로 생각한다.

AI가 의사들보다 진단을 잘할까?

아래 차트는 의사와 LLM 모델들의 감별진단(differential diagnosis) 점수 차트. 감별진단에서 이제 o1과 같은 reasoning model이 의사들과 DDx Generator (알고리즘)보다 감별진단을 잘 하는 것으로 나옴

DDx Generator와 LLM의 주요 차이는 누군가가 환자의 symptom을 정형화된 데이터로 인풋하고 알고리즘 적(deterministic)으로 아웃풋을 내는 반면, LLM은 비정형 데이터를 모두 흡수하고 직접 symptom을 찾아내어 non-deterministic한 아웃풋까지 내는 것

이 차트만 보면 이제 의사들보다 AI에 의존해도 되는 것처럼 보이지만, 이 리서치의 가장 큰 한계는 “감별진단”을 책정하는 것

감별진단이란 환자의 증상을 설명할 수 있는 가능한 질환 목록을 작성하는 것임. 즉, 답에 얼추 맞는 병명을 추가하였느냐가 중요하지, 증상에 따라 진단의 우선순위, 구체성, 실용성에 대한 점수는 매기지 않고 있음. 또한, false positive 등과 같은 오류도 책정을 하지 않는 것 같음.

예를 들어, 환자의 증상이 몸살, 두통, 피로함이라고 치자. LLM은 감기, 독감, 코로나, 말라리아 등 가능한 모든 증상을 뱉어냄. 하지만, 의사의 직업은 가능한 모든 병명을 뽑아내는 것이 아니라 병의 우선순위를 매기고 그에 맞는 치료법을 처방하는 것. 의사는 게다가 환자가 아프리카를 다녀오지 않았다면 말라리아 자체를 생각도 안하고 있을 것임.

물론 LLM들이 현재 inference time compute을 스케일링하여 현재 추론 워크로드에서 훌륭한 퍼포먼스를 보이고 있지만 아래 차트는 아직 inconclusive 한 것처럼 보임

자타공인 가장 핫한 AI 스타트업 Cursor가 이탈한 고객의 목소리를 듣는 방법

Cursor는 고객이 이탈하면 환불을 해주겠다면서 아래와 같은 automated 이메일을 보낸다고 함

이제 갓 새로운 서비스를 만들고, PMF를 찾고자 하는 스타트업들에게 고객 피드백이란 무조건 쟁취해야 하는 “must”이다. 이 사실은 모든 창업자와 VC는 다 알 것이다.

하지만, 이미 마음이 상하거나 가치를 못 느낀 사용자들이 이탈할 때 즈음엔 고객들은 이미 마음이 떠났다. 생각해보면 그 고객들은 피드백을 줄 의무도 필요성도 없다. 괜히 싫은 소리 하느니 간단한 excuse만 얘기하고 넘어간다. 답장이라도 하면 말이다.

이 중요한 고객의 목소리를 들으려면 어떻게 해야할까? Cursor는 환불을 명분 삼아 고객에게 메일을 보내고, 피드백을 끼워판다. 게다가 피드백을 조건으로 환불을 해주겠다가 아니라 환불은 너가 원하면 무조건적으로 해주는데 (no questions asked), 혹시 괜찮다면 피드백도 달라는 얘기이다.

환불을 받은 사람들 중 양심 있는 사람이라면 대부분 열심히 피드백을 해줄 것 같다. 심지어 환불을 요구하지 않더라도 회사의 진정성 때문에 피드백을 열심히 해줄 것 같다.

단기적인 실적보다 장기적인 전략과 이득을 챙기는 Cursor 팀!

구글이 돌아왔다. Gemini 모델의 반란

AI 씬에서 흑인 조지 워싱턴 등을 갖고 놀림감이였던 구글이 wokeness로부터 깨어나고 있음

Openrouter 데이터에 따르면 Gemini 모델의 사용량 기반 시장 점유율이 50% 이상!

사실 아래 그래프는 살짝 deceiving 한게 state of the art 모델이 아님; 가장 API 사용량이 많다는 뜻은 즉, 값싸면서 그나마 제일 좋은 퀄리티의 모델을 보여주는 것

SOTA는 아직까진 OpenAI인 듯; 그럼에도 불구하고 꽤 흥미로운 development

스케일링 법칙: 이젠 Pre-Training이 아니라 모델에게 “생각할 시간”을 준다

현재까지 Chain-of-Thought 기반으로 inference-time compute을 스케일링한 모델은 (내가 알기론) o1이 유일함(?)

지금까지 모델의 작동방식은 인간과 빗대어 보면 System 1 thinking (”Fast”; 즉각적인 대답/반응); Scaling inference-time compute이라 하면 AI 모델에게 System 2 thinking (”Slow”; 천천히 고민하고 plan하고 생각하는 방식)

Thinking Fast and Slow (생각에 관한 생각) - Daniel Kahneman 심리학자 책 참조

Hugging Face에서 오픈소스 모델(Llama) 기반으로 직접 test-time compute (inference-time과 거의 동일시 사용)을 스케일링(즉, 모델에게 답변을 생성할 때 필요한 brain power를 지원)해 봤더니 Llama 1B 짜리 모델이 Llama 8B의 Math-500 벤치마크에서 우위를 접함(!)

이젠 스케일링 법칙에 따라 모델 성능을 끌어올릴 수 있는 방법이 2가지 lever가 있다. 1) Pre-training 때 스케일링 (많은 사람들이 pre-training scaling이 벽을 만났다고 하지만, 아직 확인되지 못함), 2) Inference-time compute (o1와 비슷한 모델)

Exciting times ahead!

Waymo의 역전: Ride-hailing 산업 내 지각변동?

구글에 인수된 자율주행 업체 Waymo는 2018년 말(제대로 시작한 것은 2023년)부터 소규모로 San Francisco 안에서 자율주행 차량을 기반한 택시 서비스를 시작함

근데 San Francisco의 operating zone (Waymo가 운영하는 지역에 한정함; 예를 들어, 공항 라이드 같은 것은 포함 안됌)에 한해서이지만 최근엔 Lyft의 시장 점유율을 따라잡고 Uber까지 위협할 것으로 보임

다른 서비스보다 wait time도 길텐데, 왜 사람들은 Waymo를 좋아할까?

1) 차가 깨끗하고, 2) 운전기사님이 없으니 공간을 넓게, 3) 편하게 쓸 수 있고, 4) 기사님이 말도 안걸고 등등… 게다가 시간이 갈 수록 인건비가 안들다 보니 가격도 내려갈 것

정말 Elon이 오랫동안 약속했던 robotaxi 시대가 오는건가?

책 같이 읽어주는 AI 친구: 내가 절실히 필요한 AI 프로덕트

최근 Andrej Karpathy가 책을 같이 읽어주는 PhD 급 지식의 AI agent 프로덕트를 얘기하고, Gary Tan도 “이런 게 있다면 바로 투자하겠다”라고 동의하였음

개인적으로 책을 많이 읽진 않는 편; 하지만, 모두가 그렇듯, 더 책을 많이 읽고 싶은 마음은 있음

책을 유튜브 보듯이 쉽게 접하지 못하는 이유는 어렵기 때문; 어려운 non-fiction 책을 읽다보면 모르는 것도 너무 많고 이해도 안 되기에 피로도가 급격히 올라감. 이 것 때문에 책을 시작하거나 꾸준히 읽는데에 저항이 생기기 마련

최근엔 ChatGPT를 많이 사용해서 모르는 것을 물어보긴 하지만, integrated 환경(책보다 컴퓨터 보고 등등)이 아니고 항상 책을 읽을 때마다 컴퓨터에 앉아있을 순 없는 노릇이니 sub-optimal한 부분이 있음

만약에 정말 이런 프로덕트가 있으면, 나 같은 사람도 어려운 책을 더 편하게 많이 접할 수 있지 않을까?

또한, Kindle이나 e-book이 훨씬 싸고 나쁘지 않으면서도 나는 hard-book을 계속 고집해왔음. AI를 fully-leverage한 seamless 경험을 위해 책 뿐만 아니라 많은 behavior들이 디지털 환경으로 넘어오지 않을까?

스포티파이는 어떻게 $100B 회사가 되었을까?

Sheel Mohnot라는 VC의 트위터 글 발췌

나는 Spotify가 private company였을 때 투자기회가 있었지만 투자하지 않았다. 이젠 140조원 규모 회사이다.

내가 Spotify에 대해 근본적으로 오해한 것이 있는 것 같다. 하지만, 아직도 무엇인지 잘 모르겠다.

내가 이해한 Spotify는 아래와 같다:

아티스트와 레코드 레이블들이 너무 막강한 힘과 협상력을 가져갈 것임. 왜냐하면, Spotify는 “complete catalog,” 즉 음원 전체를 보유하고 있어야 하기 때문

넷플릭스는 반대로 모든 영화와 드라마를 갖고 있을 필요가 없다. 이러한 컨텐츠의 경우, 시청자들은 한번 보고 말기 때문 (많이 봐야 2~5번?). 하지만, 음악은 다르다.

예를 들어, 미국 팝스타인 Taylor Swift가 Spotify에서 나간다고 하면, 고객들이 백만명 단위로 이탈할 것이다. 즉, Taylor Swift는 반대로 Spotify 상대로 엄청난 협상력을 갖게 되고, Spotify의 마진은 훼손될 것이다. 하지만.. 현재 Spotify의 bottom line을 보면, 이렇게 예상했던 시장 다이내믹이 먹히지 않았다는 것…

왤까? 아직까지도 모르겠음.. (개인적으론 게다가 애플 뮤직 사용자로 Spotify의 사용경험을 이해하지 못하다 보니 더더욱 모르겠음…)

몇 가지 explanation으론: 1) Spotify는 전세계 모든 노래들의 “마스터 파일”이란 역할보다, 사용자 경험을 “Discover Weekly” 플레이리스트로 전환했기 때문; 이렇게 하면 힘과 협상력을 개개인의 아티스트가 아니라 playlist curator로 가져올 수 있다. 2) 전세계 100% 모든 음악 “마스터 파일”을 갖고 있어야 한다는 가정이 틀렸다. Streaming 이전에도 사람들은 모든 음악을 다 갖고 있지 않았었다 (친구 CD나 테이프 빌리는 등). 즉, 어떤 한 아티스트의 Super Fan들은 Spotify에게 큰 의미 없고, “casual & passive listener”들이 타겟임

또 다른 이유는 무엇이 있을까?

달리는 xAI와 Elon Musk

일론 머스크의 스타트업 xAI는 *콜로서스(Colossus)*라는 슈퍼컴퓨터를 구축했으며, 10만 개의 GPU를 갖추어 메타 같은 경쟁사를 크게 앞지름

이 프로젝트는 통상 3~4년 걸리는 작업을 단 122일 만에 완성

마이크로소프트, 아마존, 구글 등 경쟁사들은 xAI가 어떻게 이렇게 빠르게 진행했는지 알아내기 위해 멤피스 현장을 비밀 항공기를 띄우는 등 정보를 수집함

어떻게 이렇게 빠르게 했나?

전력망 승인을 기다리는 대신 임시 가스 터빈을 설치해 전력을 공급
멤피스 당국이 머스크의 사업 유치를 위해 승인 절차를 신속히 처리
xAI가 자체적으로 슈퍼컴퓨터를 사용하기 때문에 일반적으로 필요한 규정 준수 및 보안 테스트를 생략
지역 환경 단체들은 xAI가 허가 없이 터빈을 운영하며 대기를 오염시킨다고 비판; 각종 environmental regulation도 우회할 수 있었음. 마이크로소프트는 자사의 기후 목표 때문에 이런 방식을 사용할 수 없다고 언급

OpenAI CEO 샘 알트만은 매우 빡쳤고 마이크로소프트가 너무 느리게 움직인다고 비판함. 처음으로 마이크로소프트 외 데이터센터 파트너를 찾기 시작

Jason’s thoughts: 1) 모델은 지속적으로 거대해질 것(scaling law)이고, 2) 가장 중요한 compute을 확보하는 것이 AI 전쟁에서 이길 수 있는 길임. AI 모델 학습엔 단순히 얼마나 많은 GPU가 있느냐 보다 이 많은 GPU를 싱글 클러스터로 빠르게 잘 묶어서 학습에 사용하는게 중요. xAI가 headstart가 있는 오픈AI와 Anthropic을 무섭게 추격 중.

Source: https://www.theinformation.com/articles/how-elon-musks-supercomputer-freaked-out-ai-rivals?rc=mn9d7y

주택담보대출 이후 새로운 증권 - “AI 반도체 담보 대출”

역사적으로 담보대출은 투자 활성화를 위해 많이 있었음; 최근 위험한(?) 트렌드는 AI 반도체 담보 대출

월가에선 $11bn (~15조원)을 “neocloud” 업체들에 돈을 빌려줌 (e.g. Coreweave, Lambda 등)

Neocloud 업체들은 월가에게 돈을 투자 받고, 엔비디아 칩을 담보로 제공; 받은 돈으로 엔비디아 GPU를 더욱 구매

심지어 엔비디아는 일부 Neocloud 회사들에게 거대한 금액을 투자; 순환출자 아닌가?

옛날에 미국 및 영국에선 철도 깔기 위해 철도회사들은 자신이 보유한 track을 담보로 제공하고, track을 더 깔았음

근데 Nvidia GPU와는 다른 것이 철도 회사들의 route는 희소성이 있음; Nvidia GPU의 공급량이 어느정도 풀릴 것으로 예상되며, 감가상각이 심하고, 새로운 모델 출시로 cannibalize 되어 희소성이 보장되지 않음

아직 AI가 초기이며, $11bn은 아주 큰 돈은 아니지만 (in the grand scheme of things), the development does shine a light on some risky lending, circular financing and competition dynamics that are propping up (Nvidia) the AI boom

Link: https://www.ft.com/content/fb996508-c4df-4fc8-b3c0-2a638bb96c19

AI 파운데이션 모델은 역사적으로 가장 빠른 감가상각을 받는 자산

종합 상업용 비용 관리 플랫폼 Ramp에서 나온 데이터

어떻게 아래 데이터를 집게한지는 모르겠음; 유추하자면 AI를 사용하는 Ramp의 고객사들이 월별로 어떤 AI 모델을 사용/과금되는지 집계한 것으로 보임

2023년 11월만해도 GPT-3가 49%의 “시장 점유율”을 차지 (아래 데이터를 시장 점유율 proxy로 봄); 2024년 9월엔 9% 밖에 안됌

아무리 2024년 9월에 오픈AI의 GPT-4o가 self-cannibalize하여 44%를 차지한다고 봐도 트렌드는 확실한 것으로 보임

기존 사업들과 달리 foundation model은 수백억, 수천억원을 투자해 나온 모델이 몇 년 사이 급격히 감가상각 되는 자산이며, foundation model 회사들은 지속적으로 펀드레이징하고 자신을 self-cannibalize 해야할 운명임

역사적으로 이러한 사업모델은 처음임. 이러한 회사들의 가치를 어떻게 평가해야할지??? 결국 1~2곳의 winner가 탄생할 것인가? 아님 commoditize 되어 그 누구도 돈을 못 버는 현상이 펼쳐질 것인가?

Anthropic이 돌아왔다! Claude Computer Use

Anthropic - 어제 Claude Computer Use for Coding 출시

드디어 생성형 AI와 LLM이 back and forth 채팅 인터페이스만으로 작동하는 것 뿐만 아니라 직접 action까지 execution하는 해주는 어플리케이션..! 미래와 점점 가까워지는 것 같습니다..

비디오가 설명을 다해주네요!

스트리밍 전쟁: 압도적 1위 넷플릭스

FANG (Facebook, Amazon, Netflix, Google) 주식들이 한창 잘 나갈때 넷플릭스가 주춤한 적이 있었음

2021~2022년 사이 너도 나도 IP 보유자들 (디즈니, HBO, Paramount 등)이 다 스트리밍에 뛰어 들어서 “moat”가 없는 넷플은 이제 끝났다라고 투자자들은 사망선고를 때림

아니네? 넷플은 계속 승승장구; 다른 플레이어들은 plateau함

넷플은 왜 다를까?

(Maybe?) 생각보다 다른 이해관계 (예: 디즈니 - IP, 영화, ESPN, 테마파크 등)가 얽혀있지 않고 하나에 미치도록 몰두하는 것이 압도적인 소비자 경험을 만들었나?

주로 TV로 컨텐츠를 많이 소비하는 편인데 확실히 UI 적으론 넷플릭스가 압도적으로 잘함 (스크롤링, 컨텐츠 내 앞으로/뒤로 가는 행위 등)

또한, 넷플릭스가 컨텐츠 적으로도 글로벌 흥행을 잘 만들었던 것 같음 (e.g. Stranger Things, House of Cards, 오징어게임, 흑백요리사 등) —> goes back to my earlier point of being free of conflict of interest between different teams and functions

또 어떤 것들이 있을까???

SaaS: Lifetime Value가 다시 중요해졌다

엔터프라이즈 소프트웨어는 다른 산업과 달리 P/E 멀티플, EV/EBITDA 멀티플이 아니라 NTM Sales 멀티플로 밸류에이션을 한다. 심지어 올해 매출 멀티플도 아니라 향후 12개월 매출의 멀티플로 산정하다니?!

그 어떤 산업보다 엔터프라이즈 소프트웨어가 높은 멀티플을 받을 수 있는 이유는 3가지이다: 1) 성장률, 2) 마진률, 3) Defensibility

소프트웨어니까 성장이 빠르다. 매출총이익률도 80~90%다.

엔터프라이즈 소프트웨어는 게다가 net retention rate이 주로 100% 이상이다. Best of breed는 120~130% NDR을 받는다. 그 뜻은 즉 새로운 고객 유치 없이 기존 고객들만으로 20~30% 매출 성장을 할 수 있다는 말

투자자들은 NDR이 100% 이상이면 아무리 회사가 신규 고객 유치(아웃바운드 세일즈)를 못하더라도 작년 매출은 유지, 또는 성장할 수 있다는 확신 (defensibility / 가시성)이 있기 때문에 높은 멀티플을 줄 수 있다.

Lifetime Value는 리텐션으로 산정 (gross margin x ARPU / churn) 되기 때문에 churn이 낮으면 낮을 수록 LTV는 올라간다

투자자들은 NDR이 높으면 “미래에도 똑같이 잘하겠지”라고 가정하고 회사의 “defensibility”에 대해 인정해줬다.

하지만, 이제 이 가정이 깨지고 있다. 영원할 것 같았던 NDR은 빠지고 있다 (평균 113% —> 108%; 5% 하락). 경제가 안 좋아서 기업들이 software spend를 타이트하게 가져간다던지, AI 때문에 니즈가 하락한 것인지 정확한 원인은 모르지만 NDR이 영원히 이어질 것이란 가정은 박살났다.

인플레이션을 대입해보면 연간 기존 고객군으로부터 8% 매출 성장은 인플레이션 대비 3~5%+ 수준 밖에 되지 않는다.

그와중에 CAC payback period는 평균 35개월에서 44개월로 증가했다. 투자자들은 지금까진 마진이 좋고, 한번 고객을 유치하면 평생 갈 것(defensibility)이란 믿음이 있었기에 현재 마이너스라도 성장만 빠르고 scale-up만 되면 큰 돈을 만질 것으로 가정했다.

하지만, defensibility의 가정은 하향조정 되었고, 심지어 profitability 시점 (CAC payback)도 하향 조정되었다. 44개월이라 하면 회사는 고객 유치 후 거의 4년 동안 고객을 잡아놓고 있어야 본전이라는 뜻.

다시 LTV가 중요해졌다. AI가 새로운 다크호스로 등장한 마당에 리텐션에 대한 가정은 언제든지 틀어질 수 있다. CAC payback까지 먼 미래로 미뤄져 있다면 투자자에게 외면 받을 것.

엔비디아가 강력한 이유

아래는 Jensen Huang이 BG2 팟캐스트에 나와 얘기한 내용을 Altimeter 투자자 Clark Tang이 정리한 글

Nvidia는 풀스택 회사임. 하드웨어 (GPU, CPU, 네트워킹, 랙, DC)부터 소프트웨어 (CUDA, cuDNN, 역 호환성 등)까지 다 갖고 있음

이로 인해 진정으로 “general purpose accelerated computing”을 서포트할 수 있음 —> 어떤 모델/워크로드던지 간에 모든 이코시스템 내 pre-training, inference 모두 다 사용 가능함

사람들은 생성형 AI가 단순히 pre-training, post-training, inference 이 3가지로 나눠진다고 생각하는데 이 사이사이에 생각보다 훨씬 많은 프로세스가 숨어져있고, 이 모든 프로세스에서 accelerated computing이 필요함

결국 하드웨어 구매자 입장에선 “lifetime utilization” 이 가장 중요. 어떤 하드웨어를 사야 다운타임 없이 효율적으로 맛있게 써먹었다고 소문날까?

내가 H100 쓰다 GB200를 업그레이드 한다면 GB200를 pre-training에 사용하고, H100는 인퍼런스로 사용하면 됨. Nvidia 외 플레이어들은 generation-to-generation 간 호환성이 부족.

Nvidia는 하드웨어 (NVLink), 소프트웨어 모든 분야에서 최고 수준임. 경쟁사가 Nvidia를 제칠려면 5~10배 좋은 프로덕트를 내놔야함. 그렇지 않다면 고객사 입장에선 switching할 요인이 적음.

AI 칩 쪽 경쟁은 뜨겁다. 당연하다. Prize is too great.

하지만, ASICs에 현재 너무 기대를 하기엔 이르다. 구글이 TPU 만들기까지 10년이 걸렸고, 지금까지도 “general purpose accelerated compute”로 사용되기에 유연하지 않다.

Link: https://www.youtube.com/watch?v=bUrCR4jQQg8&ab_channel=Bg2Pod

AI 반도체 위너는 누가 될까? 리서치 페이퍼 기반 선행지표!

Air Street Capital의 State of AI 리포트에서 꽤 재밌는 지표

AI 반도체 시장은 엄청나게 포화 상태; 국내에는 리벨리온이 원탑으로 나오는 것처럼 보이지만 글로벌 시장에선 정말 정말 많은 반도체 회사들이 존재

당연히 엔비디아 주가를 보면, everybody wants a piece of it, 그러니까 당연한 현상

근데 문제는 투자자로써 이 많은 회사들 중 위너가 될 회사를 파악하기 진짜 어려움; 게다가 반도체 산업 특성 상 final product까지 오랜 시간이 걸리고, 기술 검증이 그만큼 어렵고, 세일즈 사이클도 오래 걸리기 때문에.. 정성적으로 검토하는 경우가 많음 (정량적인 검토 어려움)

스타트업 뿐만 아니라 심지어 대기업들 간 반도체 성능/트랙션을 알기도 어려움!

원래 일반적으로 사람들이 트래킹하는 지표인지는 모르겠지만 아래 그래프는 꽤 재밌는 선행지표라고 생각

각 회사의 반도체 별 AI 리서치 페이퍼의 정량적인 숫자를 보는 그래프인데 이러면 트렌드 뿐만 아니라 해당 칩의 미래 adoption을 예측해줄 수 있는 선행 지표라고 생각

Source: https://www.stateof.ai/

AI 어플리케이션의 차별 포인트는 GTM?

LLM 성능은 plateau하고 있고 앞으로도 그럴 것 - 누군가 앞으로 치고 나가더라도 성능 측면에선 금방 따라잡힘 (더 좋은 모델로 의한 synthetic dataset, 시간이 지날수록 퇴사자/커뮤니티 등을 통해 정보의 dissemination 등)

API 말고 순수 어플리케이션 측면에서 본다면 어쩌면 성공여부는 UI/UX, 기능 (functionality), underlying LLM의 성능 등이 아닌 GTM일 수도..?

ChatGPT, Gemini, Claude, Meta AI 모두 비슷한 functionality, UI/UX, LLM 성능을 지니고 있음

하지만 ChatGPT는 월간 875M visits, 다른 애들은 다 120M 수준 (7x 차이)

ChatGPT는 10M의 PU; 다른 애들은 다 1M 수준 (10x 차이)

지금까진 확실히 first-mover advantage + shipping speed - 지속적으로 새로운 기능들 (image gen, o1-preview, voice mode 등)으로 오픈AI가 유저들을 새로 유입시키고 붙잡고 있음

이러한 대형 AI 어플리케이션 외에도 어쩌면 AI 어플리케이션 내 승자는 기존 비즈니스 다이내믹과는 달리 GTM에 달릴 수도 있음

그리고 AI 어플리케이션에서 GTM이란 무엇보다 shipping speed가 강조 되는 듯

Source: https://x.com/Goyal_Vivek/status/1835404626918842855

벤처펀드 아포칼립스

Angular Ventures의 Gil Dibner 글 - The Venture Apocalypse

VC들의 과잉공급 얘기는 오랫동안 있어왔다

그리고 돈이 여러 펀드들 (대형 펀드 + 소형 펀드)에 나눠졌는데 ZIRP 시절 돈이 많을 때는 문제가 없었다

하지만, 이제 돈줄이 막히면서 emerging managers들에게 들어가는 돈이 확 줄었다. 투자자들은 1곳에만 투자해야 된다면 연혁이 길고 브랜드 가치가 확실한 대형 VC 투자사에게 출자한다.

올해 미국 내 전체 펀드레이징 중 2곳 (a16z + General Catalyst)가 거의 50%를 싹슬이 해갔다

“Venture Capital on easy mode”는 끝났다.

LP들은 자산 배분에 대해 고민하기 시작했다. 적은 숫자의 VC들에게 LP 돈이 집중될 것이며 그 과정에서 약 30~50%의 VC 회사들이 망할 것으로 예언한다.

소형 펀드들 (emerging managers)들은 2가지 방법으로 차별화 할 수 있다고 얘기한다: 아예 solo-GP, 또는 non-consesnus alpha seeker (contrarian 투자자). 무엇이 됐든 emerging managers들은 LP들에게 자기 투자상품을 판매하기 위해 빡세게 차별화 해야 할 것으로 보인다.

Jason’s Thoughts: 이 현상이 한국까진 완전히 오진 않았음. 우리 나라에선 가장 큰 LP는 모태펀드 (정부)이며 다양한 벤처펀드 육성을 위해 어느정도 재원배분을 하기 때문이라고 생각. 그럼에도 불구하고 조금씩 이러한 현상이 보이는 듯… 에이티넘 올해 1조원 규모 펀드 조성도 LP돈이 한 곳으로 몰리는 현상을 볼 수 있음. VC들 간 차별화가 매우 필요하다! 심사역으로써도 고민해야할 대목일 듯…

오픈소스 코드 에디터 - Pear AI

최근 네티즌들 사이 핫한 새로운 스타트업 - Pear AI

만들고 있는 프로덕트는 AI code editor로 Cursor, Github CoPilot, Devin과 유사하지만 오픈소스로 차별화

YC 최근 24년 가을 배치 참여

3주 전에 론칭했는데 현재 300명 DAU (트윗이 지금 430만 조회가 넘어가는데 훨씬 더 늘었을 듯)

AI code editor 분야가 천문학적 돈을 투자받고 있고 너무 많은 회사들이 탄생하는 가운데, 이 회사가 인상적인 이유는 늦게 시작했음에도 불구하고 명확히 자기들이 이길 수 있는 전략을 공개

Github Copilot을 이길 수 있는 이유? 우리는 OpenAI 모델에 국한되지 않는다. Cursor를 이길 수 있는 이유? 우리는 오픈소스이다.

AI code editor 프로덕트에서 왜 오픈소스가 중요한가?

Underlying AI 모델은 그다지 중요하다고 생각하지 않는다. 왜냐하면 최고의 AI code editor 프로덕트들은 이미 최상위권 모델을 사용 중 (commoditized)
그렇다면 주요 차별화 포인트는: 1) UI/UX, 2) 신뢰도 & 투명성, 3) 커뮤니티 및 피드백 루프, 4) 유통
이 모든 가치들에서 이길 수 있는 방법은 오픈소스 전략을 embrace 하는 것

하지만 오픈소스 기반 AI code editor 프로덕트들은 이미 많다. 왜 Pear AI가 이 싸움에서 승자가 될 수 있는가?

우리가 가장 active 한 커뮤니티를 갖고 있다 (파운더는 30만 구독자 유튜브 출신으로 PR과 유통을 꽤 잘한듯)
다른 애들은 1~2명 정도가 contribute 하지만 우리 프로젝트 내 49%의 commit (landing page, documentation, server, app)이 contributor로부터 나온다
오픈소스와 커뮤니티 활성화를 기반으로 우리의 빠른 개발 속도가 나온다.
코드 에디터야 말로 오픈소스 방식이 맞는 접근이다. 왜냐하면 각 contributor는 해당 프로덕트의 유저들이기 때문!

유통/커뮤니티 활성화에서 지속적으로 엣지를 가져갈 수 있는 이유는 founder들 자체도 오픈소스이기 때문; 유튜브, 라이브 스트리밍 등으로 build-in-public 하고 있음 (더 많은 contributor 모집 —> 빠른 개발 속도 —> 더 좋은 프로덕트 —> 더 많은 유저)

Jason’s Thoughts: Love that they are using their organic influence (youtube, twitter, etc.) to garner interest and further strategic mission of open source; love that they have a differentiated GTM and product development strategy, and lays out CLEARLY why they will win, instead of arbitrary reasons like oh we have a good team that no one can verify. This I believe is not only important to communicate to investors, but also customers who are going on a limb to try out a early-stage product

Link: https://x.com/CodeFryingPan/status/1840203597478539477

The Intelligence Age

최근 OpenAI 내 주요 인력들 이탈에 대한 얘기가 많음. 네티즌들은 이 상황에 대해 갑론을박을 펼치고 있다: OpenAI는 망했다! 아니다! AGI를 달성한 것이다! 등등..

재밌는 gossip 이긴 하지만 gossip은 gossip 일 뿐.. 그냥 노이즈라고 생각한다. 더 주목해야 할 것은 오픈AI가 올해 출시 예정인 next gen 모델, 5gw 데이터센터(들!) 등 이런 뉴스들. 오픈AI는 확실히 스케일링에 대한 conviction이 강한 것 같다

앞서 블로그에서도 다뤘던 Scaling Law, Leopold Aschenbrenner의 2027년 AGI 예측, 또 최근엔 Strawberry 까지.. 모두 이대로 가고 있고 Scaling은 전혀 멈출 생각이 없다. 그리고 이 스케일링 싸움은 쿠팡이 물류창고 네트워크를 구축하는 것과 같이 비슷한 인프라 투자가 필요한데 OpenAI가 선두주자로 있는 것은 맞다.

최근 Sam Altman이 “The Intelligence Age”라는 블로그를 썼는데 몇 가지 힌트들을 뿌려놨다.

Scaling에 대한 확신이 매우 강하다 - “deep learning worked, got predictably better with scale, and we dedicated increasing resources to it”
이젠 더 이상 목표를 AGI (Artificial General Intelligence)가 아니라 ASI (Artificial Super Intelligence)로 얘기한다. AGI는 내부적으로 이미 도달했거나, 이제는 너무 쉬운 목표인 것이 된 게 아닌가?
ASI는 몇 천일 내로 달성 가능할 것으로 보인다. ASI를 도달하기엔 적어도 6년이 걸릴 것으로 예측하는데 앞서 말한 것과 같이 AGI는 훨씬 일찍 된다는 소리 - “It is possible that we will have superintelligence in a few thousand days”

이 외 Sam Altman이 세상을 보는 시각, 철학 등을 바라볼 수 있다. 본문 읽어 보시는 것을 추천!

Link: https://ia.samaltman.com/

오픈AI 보이스 모드 드디어 출시

ChatGPT는 드디어 자연스러운 대화 (voice-to-voice)를 지원하는 고급 음성 모드를 제공. 전문 성우가 제작한 다섯 가지 새로운 목소리로 구동 bye Sky! :(

Custom instruction feature와 메모리 기능을 통해 경험을 개인화할 수 있음

새로운 기능은 Plus 사용자(월 $20)와 Team 사용자(월 $30)에게 제공됨; Enterprise 및 Edu 계층으로 접근성을 확대할 계획. 퍼플렉시티 말고 ChatGPT로 갈아타야하나..

아직 모든 사람들이 사용 가능한 게 아니고 금주 내로 차차 롤아웃 예정. 사용 가능하면 알림을 준다고 함 (어쩌면 9~11월까지도 기다려야 할 수도?)

X에 나온 것만 해도 꽤 다양한 어플리케이션으로 사람들은 사용하고 있음 - 피트니스 코칭, 기타 튜닝, 언어 학습 등등

Link: https://x.com/OpenAI/status/1838642444365369814

워렌 버핏의 주식투자 철학

아래는 워렌 버핏의 주식투자 철학; 사실 주식이 아니라 어떤 투자 (부동산, 벤처 등)라도 이렇게 투자해야 단발성이 아니라 지속가능한 투자가 가능하다고 생각

우리는 4개 criteria로 주식을 평가한다

내가 이해하는 사업인가?

단기X; 장기적으로 좋게 보는 사업인가?

정직하고 능력 있는 사람들이 회사를 운영하는가?

매력적인 밸류인가?

워렌 버핏은 절대로 단기적인 요소를 보고 투자하지 않는다. (e.g. 단기적으로 이 회사에 이런 호재가 있대!!) 단기적으로 주식이 떨어져도 전혀 개의치 않는다. 오히려 buying opportunity로 본다.

워렌 버핏 경험 상 이 회사가 인수 된다면 팔릴 가격(acquisition price)과 시장에서 거래되고 있는 가격 간 차이가 큰 경우들이 있다. 이는 회사가 저평가 되었다는 뜻이고 buy signal이다.

이러한 경우엔 우리가 인수하는 목적이 아니다 하더라도 큰 금액을 매수한다. 왜냐하면 직접 회사를 통째로 사지 않다 하더라도 훌륭하게 운영된 회사들은 장기적으로 majority shareholder던 minority shareholder던 간에 alpha (주가 상승 + 배당금)가 똑같이 배분되기 때문이다.

개인적인 생각: 1) 안타까운 것은 우리 나라 자본시장에선 misaligned incentive 덕분에 오너들(majority shareholder)이 매우 이득을 보고, 소액주주들은 피해 입는 구조… 2) 언뜻보면 위 내용이 VC 투자에 대한 것이라고 해도 이질감이 없음. VC는 강제로(?) 장기적으로 봐야하지만 주식도 똑같이 1) 장기적으로 2) 내가 이해하는 회사에 3) 믿을만한 창업가/운영자들에게 4) 좋은 밸류로 투자하자!

에듀테크 사업이 어려운 이유

에듀테크 기업들의 성공 스토리를 찾아보기 힘듦. 산업이 본질적으로 뚫기 매우매우 어렵기 때문.

한국에서 edu-tech 스타트업들이 성공하기에 왜 어려울까? 본질적으로 meritocracy를 기반한 국내 문화와 매우 entrenched 되어 있는 incumbent 및 시스템, 사회적 인식 때문이라고 생각.

기존 incumbent를 뚫기 위해선 압도적인 가치를 제공하는 기업이어야 함. Education에서 남들과 차별화 된 가치를 줄 수 있는 방법이 뭐가 있을까?

예를 들어 미적분을 10x better 한 방법으로 가르칠 방법은 없다. 미적분은 미적분이다. 하지만, "시험을 잘 보는 방법"은 다르다. 90점 받던 친구가 95점을 받는다면 사람들은 돈 10배~100배를 줄 수 있을 것이라고 생각한다. 시험 결과가 10배 나아지지 않았지만, 5점 올린 친구 입장에선 올린 5점이 자기 인생을 10배 바꿀 수 있을 것이라고 생각하기 때문.

이렇기 때문에 한국에서 제일 잘 나가는 곳이 기술과 education을 융합한 edu-tech 회사들이 아니라 사교육 시장. 사람들은 "배우는 것"에 돈을 지불하지 않음. 시험 성적을 올리기 위해 돈을 씀. 특히, 우리 나라와 같이 social mobility와 시험 성적이 100% correlated 되어 있다면..

아래는 Gian Segato (Uniwhere라는 에듀테크 회사 창업자 및 현재 Replit 개발자)의 글

에듀테크 기업들이 글로벌 "generational company"가 안 돼는 이유:

1) 글로벌 확장이 어려움: 에드테크 제품은 교육 시장이 지역적으로 silo (문화, 체계 등)되어 있어 같은 GTM playbook, 같은 제품으로 다른 나라에서 성공 하는데 어려움. 한 지역에서 성공을 거둔 프로덕트가 지역을 넘어 확장하려면 PMF가 희석되어 사용자 이탈이 높아지거나 성장력이 제한됨.

2) 기존 강력한 incumbent과의 경쟁: 에드테크 스타트업은 변화에 저항하는 기존의 incumbent 교육 시스템 (수능, 자격증, 학교, 교육 대기업 등) 및 문화적 기대(학부모, 학생 등 entrenched 된 생각과 기대)와 경쟁.

3) 수익화 문제: 에드테크 제품의 수익화는 이해관계자 간의 재정적 인센티브가 맞지 않음 (예: 부모가 비용을 지불하고 학생이 소비). 특히 K-12 제품에서 도드라짐.

4) 현재 모델의 한계: 코호트 기반 과정 (e.g. Udemy) 및 게이미피케이션 (e.g. Duolingo)과 같은 다양한 접근 방식이 시도되었지만 각각 상당한 단점이 있습니다. 코호트 기반 과정은 scale-up 때 품질을 유지하는 데 어려움을 겪고, 게이미피케이션 학습은 실질적인 교육 성과를 제공하는데 한계가 있음.

5) B2B 사업: 프로페셔널들을 위한 사내 교육 프로그램, 평생 교육 프로그램 등을 위한 예산을 갖고 있는 기업들의 수는 매우 제한적임. 그리고, 대체적으로 나중엔 이러한 대기업들이 자체적으로 컨텐츠를 생산하려고 함.

6) 에듀테인먼트: 순수한 교육 콘텐츠보다는 엔터테인먼트를 판매하는 것(e.g. MasterClass)이 돈이 벌린다는 것은 입증하였지만 실질적인 교육 성과를 내는데 역부족임.

결론: Udemy, Coursera, Duolingo와 같은 에듀테크 회사들은 어느 정도 성공을 거두었지만 앞서 말한 모델의 제한된 확장성 때문에 generational company로 성장하지 못함. 가장 edutech에서 잘 나간다는 Coursera, Duolingo도 시총 $2 billion 수준

Link: https://giansegato.com/essays/why-edtech-startups-dont-scale

Collison Installation

세계에서 가장 valuable 한 스타트업 중 하나인 Stripe (현재 $70B 밸류)의 초기 이야기

엔터프라이즈 세일즈는 어렵다. 세일즈 하나하나도 매우 어렵고, 사용자 피드백 받기도 어렵다. 사용자들은 괜히 귀찮게 시간 쓰고 마음 상하는 얘기 하느니 피드백 안하고 만다.

근데 엔터프라이즈 SaaS 파는 스타트업에게 더욱 마음 상하는 일은 잠재 고객이 사용한다고 해놓고 프로덕트를 사용(implementation)하지 않는다는 것.

이러한 상황이라면 스타트업은 프로덕트를 팔긴 팔았지만 첫 단추부터 실패했다. 결국 잠재고객이 implement하지 않으면 아무리 결재를 했다하더라도 곧 churn할 것이기 때문.

Stripe의 창업자 Collison 형제들은 아예 고객사까지 가서 설치와 implementation까지 직접 해줬다고.. 이제 스타트업 커뮤니티에선 이러한 행동을 Collison Installation이라고 한다

고객한테서 “Yes”를 받아낸다고 해서 세일즈가 끝난 것이 아니다. 유통에서도 그러듯이 라스트 마일이 가장 중요하고 가장 어렵다. Collison 형제들은 이렇게 고객들과 직접 스킨십을 가져가며 피드백을 받고 세일즈의 last mile을 잡았다.

“Do things that don’t scale”

LLM 벤치마크 테스트를 cheating하는 방법

아래는 Nvidia의 Research Scientist, Jim Fan의 트윗

LLM 벤치마크 테스트(MMLU, GSK-8k, HumanEval)의 점수를 높게 받기 위해 cheating하는 것은 매우 쉬움

아예 test set을 사용해서 학습하는 것은 루키짓; 다른 방법들도 많다

Paraphrase (워딩을 조금 바꿔서) 된 테스트셋을 사용해 학습; “LLM-Decontaminator” 페이퍼에서 MMLU, GSK-8K, HumanEval의 테스트셋을 조금만 다른 용어/포맷/언어로 바꿔 학습했더니 13B 사이즈 모델이 GPT-4를 이길 수 있었다

이러한 행위를 방지하기 위한 LLM-decontaminator도 역부족이다. LLM-decontaminator는 위와 같이 단순 paraphrase하는 데이터셋을 잡기 위해 만들어짐. 이 것을 우회하기 위해 테스트셋을 풀기 위한 로직은 같지만 새로운 질문/답변을 생성해서 학습하면 쉽게 우회할 수 있다.

또한, 프롬프트 엔지니어링을 통해 LLM-decontaminator를 쉽게 속일 수 있다. 디텍터는 퍼블릭이지만 prompt는 나만 알고 있기에 가능하다.

Test-time compute을 늘려서 모델이 CoT, reflection 등을 사용하면 점수를 더 높일 수 있다.

요즘 새로운 스타트업들이나 리서쳐들이 여전히 MMLU 스코어를 내세우고 사람들이 놀라는데 이는 전혀 신뢰도가 있는 방법이 아니다.

유일하게 모델 성능을 믿을 수 있는 방법은 1) Lmsys chatbot arena, 2) 아님 Scale AI, Artificial Analysis와 같이 신뢰도 높은 제3자 평가기관이 공개되지 않은 테스트로 시험하는 것 밖에 없다.

Link: https://x.com/DrJimFan/status/1833160432833716715

1 Billion MAU 컨슈머 어플은 끝났다; 버티컬 어플 전성시대

a16z 파트너 Andrew Chen의 글

1 billion MAU의 새로운 horizontal (수평적) 어플은 이제 나오기 힘들 것이다 (Youtube, TikTok, Linkedin, Snapchat 등)

마지막으로 탄생한 것이 틱톡이고 이마저 8년 전이다

아이폰이 나온지 15년+가 되었고, 모바일 S-커브의 막바지 시기이다

이젠 Horizontal App이 왜 어려운가?

Novelty effect (새로운 것)가 사라졌다. 소비자들은 거의 모든 아이디어에 대해서 다 들어봤고 Founder들이 모두다 시도해봤고 1 billion까지 스케일하지 않았다.

리텐션이 어렵다. 모바일 시대 초기엔 아무거나 만들어도 줄에서 기다리는 것이나 용변을 보면서 가만히 앉아있는 것보다 더 재밌으면 사람들이 다운받았다 (e.g. fart app). 하지만, 지금 시대에 새로운 어플은 이 시대 가장 중독성이 높은 어플(인스타, X, 유튜브)들과 경쟁을 한다.

이러한 수평적 어플들의 주요 비즈니스 모델은 광고이다. 광고를 안착시키는 것은 “two miracle” 문제이다. 두 번의 “기적”이 필요한다는 뜻으로 그만큼 어렵다.

일단 첫번째 기적은 천만 단위 유저들까지 스케일하는 것이다. 이 정도는 되야 광고모델로 돈을 벌 수 있는 수준이 된다.

두번째는 광고 마켓플레이스, 타게팅 시스템, 비딩 시스템 등 광고주들을 모집할 수 있는 인프라를 구축하는 것이다. 이러한 시스템 구축도 2번째 네트워크 이펙드로 작동하긴 하는데 시간도 오래 걸리고 말도 안되게 어렵다.

예전에 비교적(?) 쉽게 되었던 growth hacking 전략 (인플루언서, 퍼포먼스 마케팅 등)도 예전만큼 잘 먹히지 않음 (너무 비싸서 ROI가 나오지 않거나 리텐션이 안나옴)

미래엔 유저수는 적지만 버티컬 니즈를 잘 파고들어 더욱 높게 인당 과금(ARPPU)을 할 수 있는 버티컬 앱들이 잘 될 것!

Top 10% 유저들이 매출 견인; e.g. Free-to-Play games, 도박사이트 (draft kings) 등

수평적 어플들과 달리 네트워키 이펙트 드라이버는 “내 친구들이 있어서”가 아니라 관심사나 활동으로 이루어질 것; e.g. 친구와 상호작용하는 것이 아닌 데이팅 어플, 발로란트와 같은 게임 등

어플들의 gamification이 많아질 것 (e.g. Robinhood, Duolingo 등)

미래의 어플들은 훨씬 버티컬해질 것이다!

Link: https://andrewchen.substack.com/p/the-end-of-the-1-billion-active-user

Founder Mode (feat. Paul Graham)

이번 주 미국 롱 위켄드(labor day weekend) 때 나온 Paul Graham의 블로그: Founder Mode

Airbnb 창업자 Brian Chesky가 이벤트에서 언급하고 Paul Graham이 내용을 블로그에 정리함; 현재 실리콘밸리 내 가장 핫한 글

TLDR

회사는 두 가지 방식으로 운영될 수 있다: 1) founder mode, 2) manager mode

매니저 모드는 잘 알려져있다. 경영대학원에서 많이 연구되어 있는 분야다.

Founder Mode는 잘 알려져 있지 않다. Brian Chesky는 지금까지 Airbnb를 운영할 때 다른 사람들의 조언을 들어 “manager mode”로 운영했다고 한다. 하지만 이러한 경영방식이 틀렸다고 주장하고, 자신이 Founder Mode로 바꾸고 회사의 체질 개선을 할 수 있었다고 주장함.

매니저 모드는 무엇이냐?

“micromanaging”을 하지 않는다. 뽑은 직원에게 룸을 주고 알아서 일을 해나가게끔 도모한다.

“hire good people and give them room to do their jobs”

조직도에 따라 일을 배분하고 direct report와만 얘기한다.

하지만 매니저 모드는 “professional fakers”를 유인하고 시스템을 악용하는 사람들이 많아지고 회사를 해친다.

Founder Mode는 무엇이냐?

CEO는 direct report와만 대화나누는 것이 아니라 그게 누구든지 DRI와 직접 대화를 나눈다 —> skip level meetings (e.g. Elon Musk?)

시키고 믿어주는 것 뿐만 아니라 실무에 더 “direct involvement”를 가진다

예를 들어, 스티브 잡스는 매년 회사의 가장 중요한 100명과 company retreat을 진행함. 회사 조직도 내 가장 높은 사람 100명이 아니라 “가장 중요한 사람”을 엄선하여 밑 사람이라 하더라도 참여함

매니저 모드는 잘 알려져 있고, 이게 정답이라고 알려져 있다. 하지만 대표의 매니저 모드는 adverse selection 문제가 있다. 결국 승진을 잘하고 임원을 다는 사람들은 doers보다 manager이기 때문에 이 들에게 맡겨진다면 회사들은 builder 문화보다 mba형 사람들로 채워질 마련이다.

Founder mode에 대해선 잘 알려져 있지 않지만 새로운 트렌드가 될 것이라고 믿는다.

Jason’s thoughts: 무슨 뜻인진 알겠음. 다만, vague하고 action plan을 얘기해주지 않다보니 정확히 뭘 의미한다는지 모르겠다는 사람들이 많음. But it definitely struck a chord with many ambitious founders!

Link: https://paulgraham.com/foundermode.html

GPT-3 —> GPT-4 급 퀀텀점프가 온다. 오픈AI 일본 대표의 예견

9월 3일 어제 오픈AI 일본 대표 Tadao Nagasaki가 GPT-3 —> GPT-4 급 퀀텀점프 된 모델이 2024년 하반기에 공개될 것이라며 예견함

Leopold Aschenbrenner가 Situational Awareness에서 언급한 2 OOM 개선된 모델일 것 (해당 블로그에 대한 정보는 jasonlee 블로그 “트렌드라인을 믿어라” 참조)

OOM은 Orders of Magnitude의 약자로 Effective Compute를 의미함. Effective compute은 단순 컴퓨팅 파워 뿐만 아니라 알고리즘 효율화, unhobbling까지를 의미함

Nagasaki 대표는 100x 개선에 대해 이렇게 얘기함: “This 100-fold increase probably does not refer to the scaling of computing resources, but rather to the effective computing volume + 2 OOMs, including improvements in architecture and learning efficiency.”

차세대 모델은 “GPT-5”가 아닌 “GPT-4 Next”로 불리며 The Information 기사에서 언급한 바와 같이 Strawberry 모델의 합성데이터로 학습됨 (더 자세한 내용은 jasonlee 오픈AI 비장의 무기: Strawberry 블로그 참조)

“GPT-4 Next… will be trained with a miniature version of Strawberry that has roughly the same computing resources as GPT-4, with an effective computing load 100 times larger”

GPT-4 Next 이후 내년 출시 예정인 차세대 모델인 프로젝트 오리온은 H100 10,000개로 몇 달간 학습하였으며 GPT-4 Next 대비 10배의 컴퓨팅 자원을 추가하여 3 OOMs+ 개선이 이뤄질 것으로 예상

Plateau는 개뿔. 이제 시작이다.

고수의 생각법 (feat. g.nyuk)

최근에 책 모임에서 조훈현의 “고수의 생각법”을 읽었는데 멤버인 g.nyuk이 여기서 얻은 통찰을 정리한 내용을 살짝 각색하여 공유합니다!

📕답이 없지만, 답을 찾아야하는 순간. 고독 속에서 강해지는 법

동기: 다니엘 카네만의 생각에 관한 생각 (Thinking Fast and Slow), 앤디 그로브의 편집광 (Only the Paranoid Survive) 책을 읽고, 스스로 질문하고 답하는 사고체계의 중요성을 느낌. 그렇다면 무엇을 신경쓰며 어떤 태도로, 어떻게 생각하는 시스템을 갖춰야할까?

바로 해결될 때까지 붙들고 늘어지는 근성이다.

해결할 수 있다는 긍정성. 반드시 해결하겠다는 의지. 그리고 해결 방법을 모색하는 데에 필요한 모든 지식과 상식, 체계적인 사고, 창의적인 아이디어. 이 모든 것을 포괄하는 개념이 생각이다.

창의력은 특별한 사람만에게 있는 것이 아니다. 창의력의 실체는 창의적인 능력이 아니라 뭐든 의문이 생기면 ‘풀지 않고는 못 배기는 성격’에 있다.

모든 발견은 질문에서 시작한다. ‘왜 이런 거지?’ ‘다른 방법은 없을까?’ ‘이게 정말 최선인가?’ 이런 질문들은 하지 않는다면 생각은 시작되지 않는다.

교훈

지금 둘 수 있는 최선의 수를 제외한 다른 감정을 비워야만 묘수가 보인다.

반전의 기회는 언제든 온다.

실수도 기회도 모두 내가 만든다. 그만큼 승리는 짜릿하고 패배는 아프다. 하지만 그만큼 성장한다.

승리에 대한 복기는 이기는 습관을 만들어주고, 패배에 대한 복기는 이길 준비를 돕는다.

고독할수록 자유롭고, 고독할수록 강하다.

뜻 밖의 해답

경험과 관록을 이기는 것은 젊음의 힘과 패기이다.

과정도 중요하지만 결과도 그에 못지않게 중요하다. 이길 수 있다면 이겨야 한다. 그러기 위해선 끝까지 포기하지 않고 반전의 기회를 기다려야 한다.

실력보다도 심리가 승부를 좌우한다. 기백. 기운은 스스로 약할수록 약해고, 강할수록 더욱 강해지는 법.

이기기 위해서는 먼저 수없이 져야 한다. 따라서 지는 것을 두려워하지 않는 자만이 자신감을 가질 수 있다.

지금 있는 자리가 최선의 자리다. 지금 이 순간이 다시없는 소중한 시간이다. 모든 꿈의 출발은 ‘지금, 여기’다.

https://www.threads.net/@g.nyuk/post/C_ZrpZzy8IB/?xmt=AQGzCix5uQsvXsqSkosdctnoKJ6M-QSX6E1prGUqKvdbfw

Just do it

한 주와 8월의 마무리를 최근에 크게 감명을 준 글귀로 마무리 하고자 합니다.

똑똑한 사람일 수록 risk averse 한 경향이 많습니다. 이런 분들은 아는 것도 많고, 시도하려는 것이 얼마나 어려운 것인지 이해하고 있기 때문에 여러 리스크를 고려하게 되고, 완벽하게 준비되기 전까지 시작하기를 우려하죠.

어쩌면 제가 겁 없이 경력도 경험도 지식도 인맥도 알맹이(?)도 부족한 상황에서 블로그를 시작할 수 있었던 것도 제가 무식해서 일지도 모르겠습니다. 그리고 지금 돌이켜보면 무식해서 참 다행이다라고 생각합니다. (이러한 무식한 글 속에서 가치를 느껴주신 모든 분들께 감사드립니다!)

저를 비롯하여 많은 분들이 “해볼까?”라고 생각만 하고 아직 시작하지 못하신 것들이 많으실 것이라고 생각합니다. 또, 시작해보고도 흐지부지 해서 끝내지 못한 것들 (shipping, publishing 등)도 있었을 것이라고 생각합니다.

그 결과물이 어떻든 일단 시작하는 것이 중요한 것 같습니다. 백날 준비하고 공부해봤자 직접 해보는 것 만큼 더 좋은 learning experience가 없다고 생각합니다.

예비창업가라면 사이드 프로젝트로, 다이어트를 시작하고픈 분이라면 조깅부터, 구직자라면 하루 30분만이라도 직무에 대한 공부를 시작하는 것!

시도하지 않는 것은 안전하지만 영원히 제자리이고, 시도하는 사람들은 비록 처음엔 쪽팔릴 수 있고 깨질 수 있지만 성장 J-curve에 올라탑니다.

New week, new month! 모두 건강하고 행복하며 성장하는 9월이 되시기를 바랍니다!

Hype cycle을 따라가지 말고 주도하라

초기 Shopify에 투자하지 않은 VC들은 왜 투자하지 않았을까요?

Shopify 창업자 Tobi Lutke는 회상합니다:

VC들은 시장 사이즈가 작다고 해서 패스했다. 그 당시 온라인 스토어는 40,000~50,000 수준이었고, Shopify가 50%를 점유한다고 하더라도 벤처 스케일 비즈니스가 아니라고 판단

그 당시 시장 사이즈에 대해 VC는 틀리지 않았다. 틀렸던 부분은 온라인 스토어가 그렇게 작은 규모 밖에 되지 않았던 이유는 온라인 스토어를 만드는데 너무 많은 friction이 있었던 것

Shopify가 이러한 friction (온라인 스토어를 만들고 관리하는데 불편함)을 하나씩 없애고 나니 개인 셀러들의 르네상스

오늘 Shopify엔 4~5백만 셀러들 보유

“What a lot of free-market thinkers don’t understand is that between the demand and eventual supply lies friction. And I actually think that friction is probably the most potent force for shaping the planet that people just generally do not acknowledge.” - Tobi Lutke

이와 별도로 Founders Fund의 파트너인 Trae Stephens 글도 재밌음 - VC로써 hype cycle을 단순 따라가는 회사가 아니라 (Shopify와 같이) 주도하는 회사를 어떻게 찾을 수 있을까?

자기 비즈니스를 설명할 때 “Uber for X,” “Tinder for y” 이런 용어 안씀. One-of-a-kind 회사는 다른 회사와 빗대여 설명할 수 없음

창업자는 해당 영역에 매우 열정적이고 박학다식함. 이 들은 “핫”한 아이디어나 돈 될 아이디어를 쫓는 것과 달리 회사가 어려워지거나 투자자들이 외면해도 마이 웨이 할 수 있는 grit 있음

Peter Thiel이 얘기하 듯이 창업자는 해당 영역에 대해 자기만 아는 “비밀” (즉, 자기만 아는 유니크 인사이트)가 있어야 함. 이게 있어야만 남들과 다른 방법과 시각으로 문제를 해결할 수 있음

워낙 논란적이고 새롭고 revolutionary하니 이러한 창업자들은 모든 VC들을 이해시키지도, 설득하지도 못할 것임. 오히려 모든 투자자들이 투자하려고 하면 그 회사는 새로운 것을 하지 않는, 모든 투자자들이 동의하는 thesis의 회사일 확률이 높음. Don’t be afraid to be contrarian!

회사는 독점 지위를 가질 수 있는 확률이 있음. 이러한 회사가 처음 시작할 땐 경쟁사가 없거나 있다 하더라도 빠르게 움직이지 못하는 대기업들 정도일 가능성이 높음.

디퓨전 모델이 게임엔진을 대체한다?

구글이 발표한 "Diffusion Models Are Real-Time Game Engines" 논문 개요:

GameNGen 개요

GameNGen은 완전히 뉴럴 모델로 구동되는 최초의 게임 엔진으로, 복잡한 환경에서 실시간 상호작용을 가능하게 함
하나의 TPU에서 20프레임 이상으로 클래식 게임 DOOM을 시뮬레이션할 수 있음
실제 게임 클립과 GameNGen이 생성한 클립을 구별하기 어려울 정도로 시뮬레이션 퀄리티가 높음
아래 비디오는 사람이 게임엔진에서 게임을 하는 것이 아니라 디퓨전 모델 기반의 게임 엔진!!

훈련 과정

학습은 두 단계로 진행

RL 에이전트가 DOOM을 플레이하는 방법을 배우고, 모든 훈련 세션이 기록됨

과거 프레임들과 에이전트의 행동을 인풋으로 하여 다음 게임 프레임을 예측하는 디퓨전 모델을 학습

장기간 안정적인 auto-regressive generation을 위해 학습데이터에 conditioning augmentation

게임 개발에 미치는 영향

기존 게임엔진은 딱딱한 로직과 하드코딩으로 되었던 것과 달리 GameNGen은 훨씬 더 새롭고 상호작용적인 게임 환경의 생성을 자동화하여 게임 개발에 혁신을 가져올 수 있음
Asset creation의 필요성을 줄여, 보다 개인화되고 유니크한 게임 경험 선사 가능
개발자가 기술적 제약보다 창의성에 더 집중할 수 있도록 하여, 보다 혁신적인 게임 플레이 경험을 이끌어낼 수 있음

주요 제약 사항

현재 모델은 약 3초의 과거 데이터에만 접근할 수 있어, 장기적인 맥락을 유지하는 데 한계
이 제약은 복잡한 내러티브와 지속적인 게임 세계의 생성에 영향을 미치며, 빠르게 진행되는 반응형 게임플레이에 더 적합

Jason’s thoughts: AI가 기술력이 계속 올라오면서 이제 게임과 접점을 이루는 듯 —> 게임 투자자들, 게이머들, 개발자들 모두 재밌고 기대할 만한 주제인 듯!

Link: https://x.com/i/trending/1828675362433151031

AI 여자친구보다 AI 남자친구가 시장기회가 더 크다

a16z 게임 펀드 파트너인 Andrew Chen 글

현재는 “waifu” (wife + 일본 온라인/애니메이션을 합성한 단어 - 디지털 여자친구)가 인기지만 시간이 갈 수록 여성들을 위한 “husbando” (이건 그냥 andrew가 만들어 낸 듯)가 더 많아질 것으로 전망

왜냐? 역사적으로 에로티카/로맨스 책에 대한 수요는 남성들보다 여성들이 압도적으로 많기 때문! (차트 참조)

그런데 현재는 왜 여성들보다 남자들이 현재 AI companion을 더 많이 쓰냐?

개인적인 생각: 예전 블로그에서도 언급한 바 있지만 AI 여자친구 프로덕트들은 현재 LLM 기술 상 상호작용(interaction)에 대한 한계가 명확함 (no long-term memory, context loss 등)

시각적인 요소들에 더 쉽게 반응하는 남성들에겐 현재 기술력이 충분 (이미지 생성, 단순 티키타카 채팅 > 상호작용/찐 관계 빌딩 등)

관계 형성에 있어 남성들보단 고차원적 니즈가 있는 여성들에겐 현재 기술력 부족함

또 어떤 이유들이 있을까요? (남성들이 이러한 프로덕트에 willingness to trial 및 pay가 더 높다던지 등) 과연 로맨스 책 수요 분포와 비슷하게 AI companion 시장에서도 비슷한 양상을 따라갈까요? Why or why not?

Link: https://x.com/andrewchen/status/1827721523378938279

도메인 경험/지식: 스타트업에게 필수적인가?

개인적으로 도메인 지식은 스타트업에게 매우 중요하다고 생각하는 편

물론 Vinod Khosla 및 많은 투자자들은 오히려 스타트업 대표가 해당 도메인에서 몇 년간 일한 경험자보다 경험이 없는 것을 선호한다고 함 —> 왜냐하면 해당 도메인에서 일을 해봤으면 bias가 끼기 마련; 해당 도메인에 경험이 없는 창업자는 새로운 시각으로 문제와 솔루션을 바라봄

그렇다고 해서 창업자가 아무런 이해가 없는 도메인에 단지 핫해서, 시장이 커서, 경쟁자가 없어서 등의 이유로 뛰어드는 것은 지양해야 한다고 생각

스타트업이 성공하려면 매우 긴밀하게 해당 도메인/워크플로우/이해관계자 등을 이해해야 수많은 서비스 중 차별화를 이뤄낼 수 있음

Ask yourself: what is something I know to be true that nobody else knows or cares about? —> 지금 산업에서 하는 방식을 10배 더 개선할 수 있는 나만의 유니크한 인사이트가 있나?

세일즈, 가격정책, UI/UX, 팀 빌딩 등 기존 방식을 갈아엎을만한 나만의 인사이트

이와 관련하여 최근 YC 대표 Gary Tan이 공유한 Hacker News 글: 왜 도메인 지식이 없는 분야에서 스타트업을 하는가?

간호사 경력, 또는 적어도 헬스케어 경험이 하나도 없는 너가 왜 간호사 소프트웨어를 만드냐?

경력이 없으면 차라리 언더커버로 해당 영역에서 일을 해봐라! 실제로 최근 YC 배치에서 그런 사례들이 있었다고 함

경력이 있든 없든, 경험이 있든 없든 간에 스타트업 창업자들이 이 질문에 답변할 수 있음 펀딩은 받을 수 있을 듯: 해당 영역/문제에 대해 당신만 알고 있는 인사이트가 무엇인가요?

Link: https://x.com/garrytan/status/1827167008401871101

Keith Rabois가 창업자에게: 런웨이 말고 “lift”에 신경써라

최고 오퍼레이터 (LinkedIn, Stripe 등) 출신이자 실리콘 밸리 탑 투자자인 Ketih Rabois; 창업자들이 하는 가장 큰 실수 중 하나가 현금 런웨이에 너무 신경쓴다는 것임

회사를 비행기 이륙하는 것과 비유해보자

회사는 lift(이륙)에 도달해야지만 가치가 있다. 런웨이는 비행기(회사)가 이륙할 수 있도록 공간을 만들어주는 도구일 뿐, 본질이 되면 안됀다

Keith는 창업자가 펀드레이징을 할 때 “저희는 Y개월 런웨이를 확보하기 위해 X억원을 모집하고 싶어요” 얘기 듣는 것을 가장 싫어함

이러한 런웨이 프레임워크보다 창업자들은 “우리가 lift를 성취하기 위해 얼마의 돈과 어떤 자원이 필요하지?” 방식으로 접근해야 하고 work backwards 해야 함

예를 들어, 우리가 Lift를 하기 위해선 프로덕트 개발, 유저 인터뷰, 검증, 마케팅, 세일즈을 집행해야 하는데 필요한 최소한 금액이 X 수준임.

물론 한번의 시드나 시리즈 A 투자로 모든 리스크를 해소하고 모든 가설을 검증할 수 없음. “우리는 이 돈으로 PMF 찾을거에요” 같은 broad 한 얘기보다 매우 명확하게 우리 회사 향후 방향성을 봤을 때 3가지의 주요 리스크 (key inflection)이 있고, 금번 파이낸싱을 통해 우리 단계에서 가장 중요한 inflection X에 집중할 것이고, Y 지표로 성과를 모니터링할 것임. 그리고, 우리 모든 인원은 오로지 이 지표/리스크를 해소하는 것에 집중할 것임

“다음 라운드를 잘 레이징하기 위해선 X의 런웨이가 있어야 해 - 아니면 협상력이 너무 낮아질 것이야”와 같은 조언은 쓸데 없고 틀렸음

회사가 Lift를 달성한다? 즉, traction이 있고, viral coefficient > 1 이다? 아무리 런웨이가 3개월 남았다 하더라도 평균 이상 벤처투자자라면 무조건 투자할 것

런웨이에 너무 신경쓰지 마라. Lift를 달성하기 위해 모든 것을 집중해라!

Link: https://x.com/StartupArchive_/status/1826587667708215410

우버가 콜드 스타트 문제(cold start problem)을 해결한 방법

우버도 모든 플랫폼 기업과 똑같이 처음엔 콜드 스타트 문제가 있었음 (드라이버가 있어야 고객이 유입되고, 고객이 있어야 드라이버가 유입됨)

도데체 고객이 없는 플랫폼에 드라이버를 어떻게 유치할 수 있을까?

우버가 선택한 전략:

콜드 콜: 신규 시장 론칭 시 Yelp (국내의 네이버 사업 디렉토리 프로덕트와 유사)를 사용해 모든 리무진 회사에 콜드 콜 진행

피치: 드라이버를 설득할 땐 “택시 운전하실 땐 다운타임이 많으실텐데 중간중간에 우버 써보시고 돈 더 버실?” —> 드라이버 입장에선 기회비용이 제로이면서 돈도 더 벌어주니 굳!

리퍼럴 시스템: 드라이버가 우버 드라이버로 전환 되었을 때 리워드 시스템으로 주변 친구들에게 리퍼럴을 유도 (항상 느끼는 것이지만 특히 B2C 프로덕트에선 리퍼럴 전략은 그로쓰 해킹의 필수인 것 같음)

잠재 드라이버가 있는 곳으로 가자: 택시/리무진 운전사들이 많이 모여있는 곳은 공항 —> 공항 근처 호텔 컨퍼런스 룸을 빌려서 음식과 커피 제공 —> 드라이버들은 고객이 도착하기 전까지 음식을 즐기며 우버의 얘기를 들음 (게다가 호텔 컨퍼런스 룸들은 생각보다 성수기 때만 아니면 꽤 쌈!)

jason’s thoughts: 스타트업은 대기업처럼 시스템과 룰들이 정해지지 않고, 길을 개척해나가야 하며 매우 제한적인 리소스로 scrappy하면서도 매우 효과적으로 문제를 하나씩 풀어나가는 것이라고 생각함. 이런 초기 스타트업 스토리를 매우 좋아하는 편 —> 무려 200조 시가총액 우버도 이런 날들이 있었다!

Link: https://x.com/sgorlick/status/1811037923162181875

2024년 1분기 벤처투자 펀드 실적 현황은?

2022년 금리인상부터 벤처펀드 성과가 매우 murky해짐

포트폴리오들이 지속적으로 후속라운드를 유치하고 높은 밸류를 인정받을 땐 TVPI, IRR 등 실적 지표 보강을 위해 VC펀드들은 재깍재깍 밸류 업을 진행 (예. 100억 밸류 회사가 2,000억원에 투자유치 —> 내 펀드 멀티플은 20배!)

하지만, 2022년 이후 회사들이 많이 망가지고, layoff 진행하며 지속가능성과 BM이 의심스러워 질 땐 후속라운드가 없음 —> 후속라운드 이력이 없는 private company의 평가방법이 애매함으로 그대로 유지 (예. 2,000억원 회사가 누가봐도 망해가고 있는데 여전히 내 펀드는 20배를 먹고 있음!)

시간이 지날수록 (양심에 찔리거나 어쩔 수 없이?) VC펀드들은 조금씩 write-off(밸류 하향조정)를 진행하고 있음

최근 Carta에서 나온 VC 펀드들의 실적 하이라이트:

VC 자본집행률: 2022년 빈티지 펀드들은 24개월동안 역대 최저치의 자본 집행률을 보이고 있음 (2022년 빈티지 43%; 이전엔 주로 47~60% 레인지) —> VC들이 역대급으로 조심스럽게 투자를 진행하는 것으로 해석

Series A 졸업률: 2018년 Q1에 시드 투자 유치한 스타트업들 중 30.6%가 2년 내 Series A 투자 유치; 2022년 Q1 cohort들은 15.4%만 시리즈 A로 졸업 —> VC들이 역대급으로 조심스럽게 시리즈 A 회사들을 검토하고 있음; 추가로 스타트업들이 현재 시장상황을 고려해 자본효율적으로 운영한다는 뜻으로도 볼 수 있음

DPI: 2021년 빈티지 펀드 중 90% 이상이 DPI (실제로 회수하여 LP에게 돌려준 투자금액)이 제로(!!)

IRR: 2021년, 2022년 IRR은 박살; 물론 빈티지 별 IRR 비교는 어려울 수 있음 (VC펀드 성격상 처음엔 손실을 보다가 J-커브 그리는 형태가 많기 때문); 하지만 time-scale 별로 분석한 IRR 성과로 봐도 매우 암울한 상황 (either managers are extra careful of mark-ups right now, IRR is actually shit, or both!)

Link: https://carta.com/blog/vc-fund-performance-q1-2024/

엔화 캐리 트레이드: 주식시장 폭락 이유 이해

캐리 트레이드란 저금리로 자금을 차입해 상품이나 주식 등 자산에 투자해 차익을 취하는 기법

예를 들어 기준금리가 사실상 제로인 일본에서 엔화 자금을 연 1%의 조건으로 빌려 1년 만기 금리가 연 4%대인 한국 채권에 투자하면 연 3%의 이자수익이 고스란히 떨어진다.

꽁돈 아닌가? Yes! 다만, 각 나라의 화폐가치가 consistent 할 경우…

위 예시에서 만약에 엔화 가치가 내가 투자한 화폐(KRW)가치보다 상승할 경우, 큰 손실을 얻게 됨

일본이 저금리 정책을 장기간 동안 고수하면서 헷지펀드들이 Yen Carry Trade를 많이 함 (Sell JPY, Buy other foreign currency such as USD, AUD 등)

헷지펀드들은 돈을 빌려 엔화를 “파는 것”이다 보니 엔화는 더욱 약세로 이어짐; 반대로 헷지펀드들이 사는 FX는 강세

갑자기 일본 BOJ가 기준금리가 인상되면서 엔화 가치상승 —> 어마어마한 양의 엔화 캐리트레이드 포지션들의 손실 발생 —> 마진콜로 인해 다른 나라 국가의 투자상품을 팔고 엔화를 사들여 손실을 보고 돈을 갚음 —> 다른 나라로 가있던 돈이 다 엔화로 몰리면서 엔화 가치 상승 —> 더욱 큰 캐리 트레이드 손실 발생

Link: https://x.com/levie/status/1820355555288056314

Rabbit, Humane 폭파 이후 새로 나온 AI Pin 회사: Friend

Friend는 아비 쉬프만(Avi Schiffmann)이 만든 새로운 AI 웨어러블 디바이스. 10대 시절 COVID-19 추적 웹사이트를 개발했으며 싹수부터 노란 것으로 유명. 목에 착용하는 펜던트 형태로, 생산성 도구가 아닌 외로움을 해소하기 위한 AI 동반자로 설계됨. 주요 기능:

항상 켜져 있는 마이크가 착용자 주변의 대화를 포착 (ambient)

들은 내용을 기반으로 자발적인 메시지와 “생각”을 전송

Anthropic의 Claude 3.5 LLM으로 구동

$99에 사전 주문 가능하며, 2025년 1월 배송 예정

구독료 없음 (?? 가능할까?)

약 15시간의 배터리 수명 (??)

프라이버시/윤리/사생활 이슈는 일단 논외로 두고 Friend AI 출시와 같이 논란이 많아졌는데..

회사는 총 $2.5M을 펀드레이징 했는데 이 중 $1.8M을 friend.com 도메인을 구매하는데 사용

그렇다면 프로덕트 R&D엔 나머지 $700,000만 사용했다는 것인데… 이 돈으로 과연 비디오에서 나오는 정도의 성능을 과연 낼 수 있을까?

아님 $99 Pre-Order를 working capital로 사용해 이제부터 프로덕트 개발을 하겠다는 것인가?

결국 Rabbit과 Humane도 데모를 통해 소비자들에게 엄청난 약속을 했지만 결국 follow-through는 못했음.. 실망감만 안김.. 얘네들은 다를까?

그럼에도 불구하고 매우 재밌는 컨셉인 것은 확실합니다. 잘 되었음 좋겠네요!!!

Screw WFH - 사무실 근처로 이사를 독려해라 (Peter Thiel)

개인적으로도 동료들과 가장 재밌는 논쟁이나 친해질 수 있는 계기나 배울 수 있는 기회가 in-person meeting이라고 생각

뿐만 아니라 사는 곳 근처에서 일하면 자연스럽게 자주 보고 같이 시간 보낼 수 있는 시간이 더욱 많아짐; $1000 per month is nothing compared to the return!

별거 아닌 것 같고 직관적이진 않지만 생각보다 훌륭한 동기부여 및 growth-hacking 방법인 듯

주식의 본질: Food for Thought from Stan Druckenmiller

레전드 헷지펀드 투자자 Stan Druckenmiller가 얘기하는 사람들이 가장 많이 하는 투자 오해: “People always forget that 50% of a stock’s move is the overall market, 30% is the industry, and maybe 20% from stock picking.”

투자 퍼포먼스에 가장 중요한 요소는 Picking보다 1번 시장, 2번 산업, 3번 피킹…

“When an equity guy is playing airlines, he’s making an embedded macro call on oil.”

Thoughts: 매크로 이해도를 키우자!

😡개빡침주의: 두산로보틱스 x 두산합병 - 슈카형이 얘기하는 국내 자본시장의 문제

이 방에 들어오신 분들은 슈카 채널을 많이 시청할 것입니다. 저도 애청자이지만 어제 올라온 “사람들은 왜 국장을 떠나는가” 비디오는 처음으로 슈카형을 존경하게 되고 용기 있는 목소리에 박수와 응원을 보냅니다.

두산로보틱스(530억 매출, -200억 영업이익) 회사가 두산밥캣(10조 매출, 1조 이상 영업이익)을 주식스왑으로 인수한다고 합니다.

500억대 매출, 4,000억원 순자산 회사인 두산로보틱스의 시가총액은 약 5.4조, 두산의 최고 알짜 기업인 두산밥캣은 시가총액이 4.9조원입니다.

시가총액이 비슷하기 때문에 1:1 합병을 한다면 이 거래에서 유일한 위너는 (주)두산, 즉 오너들입니다. 두산밥캣 간접지분 14%에서 인위적으로 42%로 땡겨올 수 있습니다.

어쩌면 이 날을 위해 두산 경영진은 두산밥캣이 저평가를 받도록 주주가치를 훼손했을 것입니다. 그렇게 돈을 잘 버는 회사의 배당성향은 17%입니다. 고성장 회사라면 회사에 재투자할 현금이 필요하다 보니 그럴 수도 있습니다. 하지만 소형 중장비 회사인 두산밥캣은 도데체 뭘 위해 현금을 쟁여놓는 것일까요? 어쩌면, 주가를 인위적으로 낮추기 위해 주주환원 정책을 외면한 것은 아닌지요? 두산밥캣의 PBR은 1배입니다.

배당정책을 펼치지 않은 이유는 주식스왑이 끝나고 (주)두산이 14% 간접지분이 아니라 42% 지분이 생겼을 때 배당을 하기 위함인가요?

솔직히 VC 씬 안에서 두산로보틱스가 말도 안되게 고평가 되어 있다는 사실을 모르는 사람 없을 것입니다. 심사역이 로봇 회사를 검토할 때 두산로보틱스 멀티플로 엑싯 시나리오 짜면 그거 믿는 투심위원들 한명도 없을 것입니다.

그리고 여의도 바닥에서 두산밥캣이 저평가 되어 있다는 것 또한 모르는 사람 없습니다.

소수 지분을 들고 있는 오너가를 위한 이런 이사회 결정들 때문에 국내 주식시장은 글로벌 시장에서 외면 받고 있습니다. 또, 오너들, 경영진, 이사회를 믿고 투자한 소액주주들은 또 한번 배신 당하고 피해를 입습니다.

공신력 있고 마이크를 갖고 있는 슈카 같은 분들이 이러한 내용을 공론화해서 참 다행이라고 생각합니다. 이 내용이 많이 공론화 되어 이사회에서 특정 일부 집단만에게 이익이 되는 결정이 아니라 모든 shareholder 들을 위한 결정을 하기 바랍니다. 그리고 이 계기로 국내 자본시장도 선진화 되기를 기대합니다.

Link: https://www.youtube.com/watch?v=DSVQJjj6q6w&t=1804s&ab_channel=슈카월드

$6B 투자받은 일론 머스크의 xAI; 테슬라가 추가 $5B 투입 암시?

올해 5월 xAI는 Post Money $24B에 $6B을 미래에셋, Sequoia, a16z 등으로부터 조달함

일론 머스크는 개인 트위터를 통해 테슬라가 $5B 추가 투입 검토 사실을 암시

링크: https://m.sedaily.com/NewsView/2D99XJ5LIP#cb

Llama-3.1 405B 모델 공개!

SOTA 수준에 달하는 첫 오픈소스 모델 출시! AI 스타트업이기에 매우 exciting한 상황!

모두 405B 모델을 사용할 인프라는 없을 수 있지만 70B와 8B 모델 또한 performance enhancement(405B 모델로부터 합성데이터 - distilled learning)를 거쳐 closed AI와 경쟁력 있는 퍼포먼스 보유

8B, 70B & 405B versions as Instruct and Base with 128k context

8B and 70B distilled using data from 405B

Context length extended from 8k to 128k

Multilingual, supports 8 languages, including English, German, French, and more.

Trained on >15T Tokens & fine-tuned on 25M human and synthetic samples

Commercial friendly license with allowance to use model outputs to improve other LLMs

Quantized versions in FP8, AWQ, and GPTQ for efficient inference

Llama 3 405B, 70B, 8B matches and beast GPT-4o on many benchmarks

Supports Tool use and Function Calling

Llama 3.1 405B available on Hugging Face Inference API and in HuggingChat

왜 Meta는 자기 모델을 오픈소스할까?

Letter from Zuck:

실리콘밸리 “슈퍼 베이비”의 시작 - 출산테크(Fertility Tech)의 약진

Orchid Founder: ““I think that sex is for fun, and embryo screening is for babies. I think that it’s gonna become insane not to screen for these things.”

벤처투자자 Jack Abraham은 난소암을 유발하는 BRCA-1 유전자가 가족내력으로 있어 어머니와 이모를 잃은 바 있습니다. 자신의 아이에게 그러한 미래를 주는 것이 두려워 파트너에게 in-vitro fertilization(IVF)에 대해 이해를 구합니다.

아브라함과 그의 아내는 배아를 검사하기 위해 유전 검사 스타트업 Orchid를 선택했습니다.

Orchid는 배아 하나당 $2,500에 유전 검사를 제공하며, 단일 유전자 장애와 당뇨병, 알츠하이머 병 등의 다중 유전 인자를 검사합니다.

이 회사는 배아의 DNA를 단 5개 세포로부터 99% 이상 시퀀싱하여 과거 1%만 시퀀싱하던 방법보다 훨씬 더 많은 정보를 제공합니다.

이를 통해 아브라함은 자신의 9개의 배아 중 4개가 BRCA 돌연변이를 가지고 있음을 발견하고 “최적”의 배아를 선택합니다.

이 외 일론 머스크와 시본 질리스 같은 유명 인사들도 Orchid의 서비스를 이용하고 현재 실리콘밸리 엘리트들 사이에선 많이 사용되고 있습니다.

한 Facebook의 엔지니어: “No one is having children naturally anymore.”

생식 기술은 빠르게 성장하고 있으며, 2021년부터 2023년까지 스타트업들은 매년 약 $400 million를 투자 받았습니다. 10년 전만 해도 $100M 이상 받기 힘든 시기였는데요.

다만, 배아 유전 검사 개념은 우생학(eugenics)을 조장할 수 있다는 윤리적 우려를 불러일으킵니다.

특히 지능과 같은 특성을 “유전”과 연관을 짓는 등(유전적 결정론)에 대해 회의적인 시각이 있습니다.

Link: https://www.theinformation.com/articles/dawn-of-the-silicon-valley-superbaby?rc=mn9d7y&shared=123c599bcb272f2c

AI의 붉은 여왕 가설 - Red Queen Effect (2024-07-16)

붉은 여왕 가설이란 계속해서 발전(진화)하는 경쟁 상대에 맞서 끊임없는 노력을 통해 발전(진화)하지 못하는 주체는 결국 도태된다는 가설이다.

장기적으론 AI에 대한 보상은 현재 우리가 상상하는 것보다 훨씬 클 것으로 예상되지만, 단기적으론 AI에 대한 기대감이 과도하게 잡혀 있을 가능성이 크다고 생각합니다.

AI의 회의론자들은 거대한 CapEx를 정당화 할 리턴(즉, 잠재고객들이 AI 서비스를 위해 지불할 금액)이 턱 없이 부족할 것이라고 생각하고 있습니다. 개인적으론 이러한 framework 보다 AI로 인한 비용절감 효과를 보는 것이 더 올바른 시장 전망 방법이라고 생각합니다.

그럼에도 불구하고 AI의 투자금에 버블이 아예 껴있지 않다는 것도 아닙니다. 분명히 많은 회사들의 투자금은 영원히 회수 되지 못할 수도 있습니다.

하지만, 이는 어쩔 수 없는 현상입니다.

예를 들어, 애플과 삼성 같은 거대 기업들이 끊임없이 새로운 스마트폰 모델을 출시하기 위해 경쟁하고 있습니다. 새로운 기능이나 모델이 즉각적으로 수익을 크게 증가 시키지 않더라도, 게임 이론 상 시장 점유율을 유지하고 고객이 경쟁사의 최신 제품으로 전환하는 것을 방지하기 위해 업그레이드가 필수적입니다.

현재 AI는 매우 중요한 플랫폼 시프트로서 우리는 새로운 산업 진화를 목격하고 있습니다. 기업들은 AI를 채택하거나 투자하지 않으면 시장 점유율을 잃고 점차 무의미해질 위험이 있습니다.

경쟁업체가 AI에 투자하고 있으므로, 나도 속도를 맞추기 위해 투자해야 합니다. 이러한 투자는 즉각적인 수익 증가나 모두에게 똑같이 배분 되지 않을 것이지만, 확실히 최종 사용자 경험을 증진 시켜줍니다.

경쟁자가 더 나은 사용자 경험을 제공하고 내가 그러지 못한다면, 중장기적으로 뒤처질 위험이 있습니다. AI의 궁극적인 보상이 우리의 현재 기대를 초과할 것이라고 저와 같이 믿는다면, AI에 대한 투자는 선택이 아니라 필수입니다.

투자하지 않으면 경쟁자에게 경주를 포기하고 시장 점유율을 잃는 것을 의미합니다. 이것이 레드 퀸 효과입니다.

저는 AI로 시장을 선도하는 사람들이 초기 투자에서 기하급수적인 수익을 얻을 것이라고 확신합니다. 따라서 AI에 대한 투자가 그만한 가치가 있다고 굳게 믿습니다. 그 보상은 거대하고 노력할 가치가 있습니다.

Link: https://cloudedjudgement.substack.com/p/clouded-judgement-71224-the-red-queen

돈나무 언니의 AI 친구 리포트 (2024-07-12)

아크 인베스트(Ark Invest)와 돈나무 언니(Cathie Woods)는 잘 알려진 인물들입니다. 테슬라든 바이오든 성장 산업에 대해 항상 매우 낙관적이고 야심찬 리포트로 많은 이들의 관심을 받고 있죠. 이번에는 "AI Companion"에 관한 흥미로운 리포트를 발표했습니다.

저는 이전 블로그 글 “AI 트렌드를 보려면 AI 여자친구를 보라” (https://buly.kr/CWsFTNm)에서 AI Companion 시장이 매우 흥미롭고 AI 트렌드를 직관적으로 볼 수 있는 시장이라고 언급한 바 있습니다. 아래는 주요 내용 TL/DR.

AI 동반자는 생성 AI로 구동되는 가상 캐릭터와의 직접적인 상호 작용을 통한 엔터테인먼트 및 사교 형태

Replika와 Character.AI가 각각 AI 동반자 플랫폼의 가장 성공적인 예시. 그러나 현재 트래픽은 이러한 단순 챗봇 형태에서 다양한 형태로 분산 중.

AI 동반자는 성인 엔터테인먼트와 NSFW(작업에 적합하지 않은) 콘텐츠에서도 주목할 만한 성장을 이루고 있음. 2024년 3월까지 NSFW AI 웹사이트는 온라인 성인 엔터테인먼트 플랫폼인 OnlyFans에서 점유율 14.5%를 차지했으며, 이는 1년 전 1.5%에서 크게 증가한 수치 (pic 1).

온라인 활동이 물리적, 대면 활동보다 편리하고 접근성이 뛰어나기 때문에 지루함을 해결할 수 있는 매력적인 대안임 —> AI Companion은 더욱 가속화 할 것 - 2023년부터 2030년까지 전 세계 사람들이 온라인에 소비하는 시간은 깨어 있는 시간의 40%에서 50%로 25% 증가할 것을 전망.

이미 AI 동반자의 채택 속도는 소셜 미디어와 온라인 게임의 초기 확산 속도보다 약 150% 빠르게 진행되고 있음 (refer to pic 2)

2023년 5월 출시된 Character.AI 앱의 월간 활성 사용자(MAU)는 텍스트 중심의 사용자 인터페이스에도 불구하고 하루 평균 0.6시간을 사용하고 있음. 이는 2023년 Roblox의 평균 사용 시간과 비슷하며 데이팅 앱의 평균 사용 시간인 약 0.1시간보다 훨씬 높지만 소셜 미디어의 평균 사용 시간인 약 0.8시간보다는 낮음 (refer to pic 3)

플랫폼이 더욱 몰입형으로 발전함에 따라 AI 동반자에 대한 참여도는 향후 몇 년 동안 현재의 소셜 미디어와 온라인 게임 평균 사이에서 유지될 가능성이 높다고 전망

AI 동반자 플랫폼이 소셜 미디어 광고와 인플루언서 마케팅의 점유율을 차지할 것이며, 개인화된 AI 동반자가 소비자의 구매 패턴에 큰 영향을 미칠 것으로 전망 (refer to pic 4)

Link: https://www.ark-invest.com/articles/analyst-research/is-ai-companionship-the-next-frontier-in-digital-entertainment?fbclid=IwZXh0bgNhZW0CMTEAAR3cFx8puNmHRFsF8otc4h41RNh55pWVYqGuUMgnqj_s7UMfFVeuejaPXJQ_aem_OSnVHyPoAVBgi1HQTB8BeA

트렌드라인을 믿어라 - 2027년 AGI는 온다: 소베린 AI를 고민할 시기 (2024-07-11)

다음 주 올라갈 블로그의 주요 내용을 정리해봤습니다!

아래는 Leopold Aschenbrenner (전 OpenAI Superalignment 팀)의 Situational Awareness 블로그의 TL/DR. 2027년까지 AGI가 올 것이며 그에 대한 본인의 생각을 논리와 evidence 바탕으로 설명한다.

AGI는 우리가 생각하는 것보다 가깝게 있다. 트렌드라인을 따라가면 2027년까지 도달 가능하다.

많은 시장 참여자들이 우려하는 스케일링에 따른 수확 체감 (diminishing return)은 나타나고 있지 않다. 모델들은 그저 배우고 싶고, 스케일링하면 더 배운다.

💡

The models, they just want to learn; you scale them up, and they learn more.

2023년 기준 향후 4년간 약 100,000배 총 컴퓨팅 스케일업이 예상된다. 이는 GPT-2(2019)와 GPT-4(2023) 사이즈 스케일업이다.

스케일업을 통해 GPT-2에선 유치원생 급 지능, GPT-4에선 똑똑한 고등학생 수준까지 올라왔다. 2027년엔 PhD 급 지능이 가능하지 않을까?

물론 챌린지는 많다. 데이터 바틀넥, 알고리즘 혁신 속도 등 AGI에 도달하기 위한 현실적인 장애물은 많다. 하지만 이 벽을 뚫기 위해 전세계 어마어마한 인적자본과 돈이 투자되고 있다.

또한, 역사적으로 인공지능의 회의학파는 지속적으로 AI의 발전속도를 과소평가하였다. 우리는 지금도 적어도 몇 년을 걸릴 것으로 예상했던 Evaluation 벤치마크 (e.g. MMLU)를 몇 개월만에 saturation하고 있다.

트렌드라인은 확실하다. AGI는 2027년에 도달 가능할 것으로 보이고, 오히려 입증책임은 회의론자들에게 있다. 그들은 왜 갑자기 역사적 트렌드가 꺽일 것으로 생각하는가?

개인적인 생각:

AI에서 최고 똑똑한 사람들: Elon Musk, Greg Brockman, Sam Altman, Mark Zuckerberg, Kevin Scott 등등이 모두 스케일링을 믿고 있고, 막대한 자금을 사용하면서 행동으로 믿음을 반증하고 있다. 내가 AI 엔지니어가 아니니 눈으로 보고 느끼지는 못하지만 이들과 반대되는 생각을 할 이유는 없다고 본다.
2027년까지 AGI 예측이 맞든 틀리든 미국 및 중국 내 AI는 기하급수적으로 개선되고 있다. 이는 자국 및 컴퓨팅에 접근 할 수 있는 몇몇 기관 및 기업들에게 엄청난 어드벤티지임. 이제 조만간 Sam Altman이 얘기한 Universal Basic Income (기본소득), 아님 Universal Basic Compute를 기대해야 하는 것일까?
AI race에서 우리나라가 뒤쳐지는 마당에 이 양상이 지속된다면 다른 나라(미국, 중국)에게 AI와 컴퓨팅 자원을 기대할 수 밖에 없지 않을까? 소베린AI를 진지하게 고민해야 할 시기인가?

AI 쇼핑 에이전트 프로덕트! (2024-07-09)

다음 주제로 넘어가도록 하고…

오늘은 꽤 재밌는 AI 쇼핑 에이전트 프로덕트입니다! Shout out to @멜론머스크.

Styl이라는 앱인데요. 미국 명문대인 듀크대 학북생들이 만든 “Tinder for Clothes” 어플리케이션입니다.

개인화가 중요해진 시점에 추천 알고리즘의 중요성은 모두 다 알고 계실 것입니다. 넷플릭스, 아마존 등 최고의 어플리케이션들은 추천 알고리즘 때문에 성공했다고 해도 과언이 아니죠 (maybe a little?).

좋은 추천 알고리즘을 위해선 유저의 선호도 데이터를 잘 축적하는 것이 가장 중요할 것입니다.

하지만 기존 쇼핑몰의 유저 인터페이스는 유저의 선호도 데이터를 축적하기 최적화 되어 있지 않습니다.

기존 쇼핑몰들은 여러 상품들을 쭉 나열해놓고, 유저들이 좋아하는 상품이 눈에 들어오면 이어지는 행동 (CTR, 체류시간, 쇼핑카트 등)을 measure 하죠.

하지만, 이런 방식은 고객의 진정한 intent를 파악하기 어렵습니다. “정황증거”로 유추를 하는 것이죠.

Styl은 “Tinder”처럼 옷을 하나씩 보여주고 “swipe right,” 또는 “swipe left”를 통해 고객의 정확한 intent를 파악하고, 해당 데이터셋으로 고객의 preference(선호도)를 학습하여 더 뾰족하고 즐거운 고객경험을 선사하고자 합니다.

매우 재밌는 UI/UX 해킹 방법인 것 같네요. 다른 분들은 어떠신 것 같나요? 쇼핑을 즐겨 하시는 분이라면 사용의도가 있으실까요?

Link: https://www.instagram.com/reel/C8LEHOFyVC9/?igsh=MWd6bXV5Nmc3NDh1dA==

오픈소스 리더보드 업스테이지 퍼포먼스 논의 (2024-07-08)

즐거운 월요일 아침입니다! 오늘은 이 오픈챗의 취지와 맞게 최근 제가 본 AI 뉴스에 대해 공론화하고 대화를 나눠보고자 작성했습니다.

7월 1일 “Hugging Face releases harder, faster, stronger open-source leaderboard”라는 제목으로 카톡방에 업스테이지에 대한 내용을 올린 바 있습니다.

주요 TLDR은 아래와 같습니다:

최근 오픈소스 모델들의 성능이 빠르게 개선되면서 기존 오픈소스 Evaluation 벤치마크들이 Saturation 현상을 보여줌 (pic 1) —> 좀 더 쉽게 설명하자면 오픈소스 모델들의 성능들을 판별하기 위해 시험을 만들었는데, 모두 다 100점을 맞으면 우위를 판별하기 어려움.

그렇기 때문에 Hugging Face (오픈소스 모델 헙 플랫폼)은 더 어려운 시험으로 평가하기 시작! (비유하자면 고등학교 졸업하고 대학교 시험을 주기 시작)

매우 흥미로운 지표는 벤치마크 v1에서 v2로 업데이트 하고 나타난 각 오픈소스 모델들의 랭킹 변화 (pic 2). Upstage의 SOLAR 모델은 기존 오픈소스 리더보드 9등에서 46등으로 급하락함

제가 개인적으로 너무나 궁금한 사항은 왜 다른 오픈소스 모델들 대비 랭킹이 급격하게 떨어졌을까요?

제 매우 짧고 얕은 지식을 바탕으로 유추해볼 수 있는 것은 기존 SOLAR 모델이 v1 evaluation dataset에 오버피팅 되어 있었음 (비유하자면 고등학교 수학시험에서 한 친구가 정말 수학의 원리를 배운 것이 아니라 시험의 답안지를 외워서 좋은 성적을 받은 느낌)

답안지를 외운 친구의 경우엔 시험을 잘 볼 수는 있다 하더라도 실제 사용을 해보면 기초 원리를 파악하지 못하고 있으니 사용성이 떨어질 수 밖에 없음

제 목적은 특정 회사를 비방하려는 목적이 아니라 순수 호기심 (truth-seeking, first-principles thinking)으로 봐주시면 감사하겠습니다.

아래 주제로 생각을 공유 해주시면 좋을 것 같습니다!

위 오버피팅 외에도 급격한 랭킹하락에 다른 사유가 있을 수 있을까요?

왜 이 내용이 공론화 되지 않을까요?

생각보다 중국 오픈소스 모델들이 매우 좋은 성적을 보이고 있습니다 (pic 3). 이 것은 어떻게 해석해야 할까요?

P.S. 만약에 업스테이지 모델이 오버피팅 되었다고 하더라도 훌륭한 성과입니다. 저는 정황상 오버피팅이 되었다고 의심하는 것이고 다른 이유가 있나 탐구하기 위해 주제를 가져왔습니다. 또한, 이미 모든 오픈소스 플레이어 뿐만 아니라 거대 AI 회사들도 자기 모델을 부각시키기 위해 Evaluation 벤치마크를 어느정도 본인에게 유리하게 게임하긴 합니다. 그렇기 때문에 이런 3rd party benchmark (Lmsys, HF 리더보드 등)이 중요합니다.

💡 Inspiration of the Day: 🤯 Absolutely Bonkers AI Avatar Product for Creators! 🎨🚀 (2024-07-04)

Founders of Argil.ai worked on their startup for 5 years and 2 rejections until they got accepted to YC (starting next week!)

Hard pivoted and burned Argil v1 last October (dropped all initial projects and went all in on AI avatars for content creators)

Benchmarked competitors and tried all open-source models; nothing met their expectations and built their own

Over the past 6 months, worked their way through dozens of research papers, iterated 100s times, and finally got breakthrough moment around March

Built SOTA and cost-efficient AI avatar model

Now, after their product release:

Went viral; 70 million views over all socials of demo (Mark Zuckerberg video below)
12k people on waiting list
Starting YC next week

Thoughts: The demo video is out of this world; props to the team for grinding out a solution and solving technical challenges despite overwhelming odds! It seems like they received 2.5m~5m euros according to EU-Startups; I guess it’s possible to build an amazing non-LLM foundation model from scratch without crazy funding!

Link to Zuckerberg reacting to Grok (AI avatar generated parody): https://x.com/BrivaelLp/status/1769482175005577571

Meta’s New Text-to-3D Generator Creates 3D Models in Under a Minute (2024-07-03)

New Meta 3D Gen platform delivers text-to-3D asset generation with high-quality geometry and texture

“This system can generate 3D assets with high-resolution textures & material maps end-to-end with results that are superior in quality to previous state-of-the-art solutions — at 3-10x the speed of previous work,” Meta AI explains

This is functionally similar to text-to-image generators like Midjourney and Adobe Firefly, but 3DGen builds fully 3D models with underlying mesh structures that support physically-based rendering (PBR).

Support for PBR materials allows for realistic relighting of generated 3D objects. This capability is crucial for integrating AI-generated assets into real-world applications and existing 3D pipelines.

3DGen combines two of Meta’s foundational generative models, AssetGen and TextureGen, focusing on the relative strengths of each.

“Meta 3D Gen is a two-stage method that combines two components, one for text-to-3D generation and one for text-to-texture generation, respectively” says Meta AI (refer to pic 1)

Meta says that based on feedback from professional 3D artists, its new 3DGen technology is preferred over competing text-to-3D models “a majority of the time” while being three to 60 times faster.

It is worth noting that by separating mesh models and texture maps, 3DGen promises significant control over the final output and allows for the iterative refinement common to text-to-image generators.

The system’s texture generation component, Meta 3D TextureGen, can create high-quality and globally consistent textures for complex 3D geometries in less than 20 seconds. It also includes a texture enhancement network capable of upscaling textures to 4K resolution, meeting the demands of high-end visual applications. (refer to pic 2)

This breakthrough could potentially bridge the longstanding gap between AI-generated content and professional 3D workflows.

For the gaming industry, Meta 3D Gen could accelerate the development of expansive virtual worlds, allowing developers to rapidly prototype and iterate on environments and assets. In architecture and industrial design, the system could enable quick visualization of concepts, speeding up the design process and improving communication with clients.

The technology also has significant implications for the growing fields of augmented and virtual reality. By lowering the barriers to creating high-quality 3D assets, Meta 3D Gen could accelerate the development of immersive experiences for education, training, and entertainment.

Link: https://venturebeat.com/ai/meta-drops-3d-gen-bomb-ai-powered-3d-asset-creation-at-lightning-speed/

My Views on Generative AI Landscape (2024-07-02)

Below, I share some of my own thoughts on the current generative AI landscape. This is an edited excerpt from an internal memo.

1. Where will the opportunities arise in Gen AI?

So far in Gen AI, value has accrued towards bottom of the value chain (e.g. Nvidia; about 80%+ so far), as seen during cloud transition (refer to pic 1)

As cost of compute stabilize, many expect Gen AI value stack to shift in to a V-shape, awarding those higher up the stack (application, dev tools which are more consumer-facing - refer to pic 1)

The billion dollar question is, will there be a renaissance of individual AI applications worth billions of dollars on the backs of OpenAI, Anthropic’s API, or will it be foundation model companies gobbling everything up?

My thoughts —> it is ok for application companies to PARTIALLY use larger model player API to power some amount of critical workflow (synthetic data generation, reasoning, etc.), but it is not enough to just build fancy UI around an API. So far, application companies that have found success (generating recurring, quality revenue) such as HeyGen, PhotoRoom, ElevenLabs, Runway, MidJourney, Perplexity, Cognition Labs no doubt leverage larger models but all own a critical component of the workflow

The more you can build in-house to offload critical workloads to internal assets AND drive better customer value vs. off-the-shelf solutions (e.g. OpenAI API), greater moat you will be building

Another question is, will SaaS incumbents with established distribution, be able to reap benefits from AI upsell? So far, answer is No (e.g. Notion, Adobe, Figma, etc.). Time will tell as applications begin to charge customers for AI features (e.g. ServiceNow)

2. Is AI a hype?

Some very smart investors believe investing in foundation models + hardware layer is ridiculous.

“Foundation models are the fastest depreciating assets in history.”

Despite recent VC fundraising difficulties, investors have piled into AI, rewarding the sector with hefty valuation and check sizes

AI is only 3% of total deals, 15% of total capital, but 5x the valuation and 6x the round size of non-AI companies. Excitement is real.

Pessimists worry about the capital-intensive nature of the business, and no hard evidence to back up an ROI claim —> it is true there is zero, tangible evidence of AI showing ROI in production at scale as of right now

Question over ROI is central to the debate over whether AI is a bubble or not

Napkin Math (refer to pic 2): Assuming 25% ROIC on $2.4T Net PP&E (investment over 2 years) equals $600B; You need $1.8T in return ($1.2T D&A + $600B ROIC). That equates to getting rid of 5% of payroll in OpEx, or 3% increase in rev at 50% EBIT margin. Personally, I think this is doable.

Another evidence point is comparing earnings multiple of Nvidia with Cisco at internet hype

Cisco saw its earnings multiple skyrocket from 37x to 132x at its internet bubble peak, while Nvidia’s 5 year average earnings multiple is 40x, and is currently trading at 39x

3. Where should we invest?

As an AI optimist, I find these 3 areas particularly interesting:

Platform Plays

Most likely should invest in “platform plays” that gives exposure to multiple verticals, workflows, and value chain. Prime example is Hugging Face which gives investors exposure to 1) open-source ecosystem (likely to be a significant component of AI), 2) horizontal workflow of everything MLOps, 3) powerful direct access to enterprises and developers. Another great examples could be LangChain (orchestration, evaluation, monitoring etc.) or Databricks (data infrastructure), albeit way too highly valued to justify entry now.

Country-specific Plays

Country-specific plays is another area of interest - AI is a strategic asset to any country, just as it is with chips, and while the timing of regulation is up to debate, it is bound to come. Within this line of thinking, Sakana (Japan) and Mistral (Europe) fits the bucket.

While language may not be a bigger differentiator as most would assume, I believe country-specific incentive to build AI independence and the regulation to support it will be.

Modality / Vertical Specific Plays

Much harder to find than the two above. Companies must have 1) great teams, 2) amazing product with proprietary technology (foundation model level, or significant tech differentiator), 3) revenue track record (not just experimentation, but in-production that are quality-recurring revs).

Above three things are MUCH harder to prove than most think, and it is a stronger moat than people realize (what if OpenAI does it? kind of questions). Companies I’ve mentioned above are all great examples (HeyGen, PhotoRoom, ElevenLabs, Runway, MidJourney, Perplexity, Cognition Labs).

New Architectures?

There are talks of investing in new architectures more recently within investor and research community (e.g. state-space models such as Mamba model from Cartesia). Extremely high-risk and moonshot - only makes sense if investor already has high exposure related to transformer architecture. Interesting area nonetheless.

Hugging Face releases harder, faster, stronger open-source leaderboard (2024-07-01)

How did Upstage’s Solar model perform in the new leaderboard? 🤯 Check out below to find out:

Why Leaderboards are Important

Evaluating and comparing LLMs is hard. Hugging Face team wanted to reproduce and compare results from several published models. It was a nearly impossible task.

Scores in papers or marketing releases were given without any reproducible code, sometimes doubtful, but in most cases, just using optimized prompts or evaluation setup to give the best chances to the models.

They therefore decided to create a place where reference models would be evaluated in the exact same setup (same questions, asked in the same order, etc.) to gather completely reproducible and comparable results; and that’s how the Open LLM Leaderboard was born!

Problem with Leaderboard v1

Leaderboard v1 became too easy for models. For instance, models are now reaching baseline human performance on HellaSwag, MMLU, and ARC (saturation)

Newer models showed signs of contamination (models were trained on benchmark data - some scores stopped reflecting general performance of model and started to overfit on evaluation datasets)

Some benchmarks contained errors (MMLU for instance)

Leaderboard v2

Updated the leaderboard with new benchmarks with uncontaminated, high-quality datasets, using reliable metrics and measuring model capabilities of interest

Six new benchmarks (MMLU-Pro, GPQA, etc.) covering general tasks such as knowledge testing, reasoning on short and long context, complex math abilities, instruction following, etc.

New Rankings (refer to pic 1)

Ranking changes from v1 to v2 (refer to pic 2); Upstage Solar model dropped 37 in ranking from 9th to 46th! What happened? Chinese models are doing surprisingly well, with Alibaba's Qwen topping the leaderboard!

Exponential rise of training costs for LLMs. Is it sustainable? (2024-06-28)

Managing Partner of Thoma Bravo (Enterprise Software PE firm - $130B AUM) recently commented on exponential cost increase of LLM training. TLDR as well as my thoughts below:

Economic theory—particularly in the technology industry—has long suggested that supply-side innovation can cause prices to fall rapidly for critical infrastructure, even with increasing demand.

Gordon Moore, the co-founder of Intel, saw that theory in action. Moore observed that as the number of transistors on a computer chip doubled over a period of about 18 months, the price of the chip over the same period fell by about half.

But fast forward to 2024, and generative AI seems to be turning Moore’s law on its head: costs of training the next generation of LLMs aren’t halving; instead, prices have roughly doubled every nine months.

So what explains this reversal? It’s all about how LLMs scale. To date, many of the AI race’s main drivers have seemed to be hyper-fixated on scaling up the existing architecture. Many LLM champions believe that to get to where AI wants to go, “scale is all you need”.

But today, I’m hearing more and more about scaling down. In stark contrast to LLMs, the small language model (SLM) “theory” is that smaller models, more tightly engineered for narrower applications and domains, will increasingly supplant LLMs.

SLMs are also typically trained on finely curated high-quality data sets—analogous to the high-octane gas that the four-cylinder engine needs to use. As such, the costs of SLMs may map more closely to Moore’s law than their large-language counterparts.

My thoughts: I absolutely agree that SLMs are going to increasingly penetrate and take on workload from LLMs to optimize latency and efficiency. But, LLM scaling will absolutely continue - not to mention the infinite amount of new capabilities a reasoning ability step-up would open up leading to exponential increase in reliance to these LLMs, where do you think you get the high-quality, scalable synthetic data for highly vertical workflows in the first-place? Scaling will continue - albeit many LLM companies may not be able to withstand CapEx and ROI pressure.

의견/생각 편하게 말씀 부탁드립니다^^

Link: https://www.linkedin.com/posts/holden-spaht_this-chart-about-the-costs-of-training-ai-activity-7212192471525511168-aprH/?utm_source=share&utm_medium=member_ios

Rippling Memo 2019 (2024-06-26)

Rippling led by Parker Conrad is one of the largest software wins in recent history. Their product strategy and execution is a chef’s kiss case study for building a startup. They chose “onboarding software” and “system of record” for employee data as point of entry in a highly competitive market dominated by incumbents, and WON. They are a premier example of why horizontal strategy, not vertical, is the way forward to build enduring value.

At the time of the memo (2019), the company raised Series A $45M at a $300M pre-money valuation. Most recently (2024 March), company raised Series F $200M at a $13B pre-money valuation.

What’s notable is that they didn’t use a slide deck for the Series A IR; instead, they used a 11 page memo, a practice Rippling has adhered to until today. TL;DR below:

Why use a memo, instead of a slide deck? Decks are the default format for startup fundraising, but they have one major downside: they’re merely a visual aid to accompany an in-person presentation. Memos are standalone, requires less up front face time, and aligns more closely with the material your sponsoring GP will ultimately put together about the investment. Interesting!

Problem Statement:

Most businesses have dozens of systems that maintain a list of their employees, and for the most part, none of these systems talk to each other or to any central system about who these employees are.

Whenever something changes about an employee, many (and sometimes, all) of these systems need to be updated, and because they don’t point to any central authority, they each need to be updated separately and by hand.

We believe that the effort to maintain this fragmented employee data across all of a company’s business systems is, secretly, the root cause of almost all the administrative work of running a company.

Company Strategy:

If you can be the system of record for employee data, you can build a really successful business. Being the system of record for employee data is lucrative because this system has platform power that can be used in other business software and services categories that need to access this underlying employee data.

Product

Understanding employee data lets Rippling answer questions like “who are your employees? what is their role or level or function in your organization, and therefore what type of access do they need to do their job?”

Knowing answers to these questions naturally helps Rippling expand from simple onboarding software to ITSM, HR, Finance, and other crucial ERP functions.

Check out the full Rippling Memo below.

Rippling-Memo-Metrics-Redacted.pdf

2748.4KB

What it takes to be valued at >10x Rev (2024-06-25)

Insight and evidence-packed article by Jamin Ball from Altimeter; Calls for founders and investors alike to be grounded in reality and paints a harrowing picture of current market sentiment… TLDR below:

Private companies often think they’ll exit at a >10x revenue multiple because “that’s where Snowflake is trading and we’re also a data infra business.”

It’s never that simple, so I wanted to lay out what it really takes to receive a premium multiple in the public markets. This is obviously based on markets today, which can fluctuate.

Top 20 software companies with the highest revenue multiples (8x-21x) share these traits:

All are FCF positive with a median FCF margin of 27%.
LTM revenue >$600m, with most >$1B.
LTM growth between 11%-42% (median 25%).
Market caps mostly >$10B.

The surefire way to receive a premium multiple is to show FCF margin leverage and profitability at scale, with modest growth. Easy enough :)

What’s most interesting is scale (ie revenue scale) and FCF are more of a consistent factor than growth (🤯)

Revenue multiples are tricky. Revenue multiples include assumptions not only about growth, but margins, market opportunity, competitive dynamics, and long-term intrinsic value.

What is the market telling us today? Those outer year long-term assumptions are a lot more unknown and uncertain today. And when uncertainty goes up, multiple goes down.

For these companies, their higher revenue multiples from the past never ended up making sense

All of this to say - not all software is created equal. There really should be A LOT of dispersion when it comes to revenue multiples. We can’t simply assume every cloud software company will eventually hit 20%+ FCF margins, and can grow 20% at scale. The last two years have made this abundantly clear.

The market today is simply saying “we don’t want to make assumptions about your profitability or growth at scale. We’ll pay the high multiple once the company is established and scaled.” The fact that 80% of the 20 highest revenue multiple companies have >$1B in revenue (and 100% of the top 10 are >$1B in revenue) shows this. IF you’re able to hit platform scale, and IF you can show FCF leverage, then and only then will you be rewarded with a premium multiple. For everyone else, they find themselves in a “prove it” stage (3~5x rev).

Link: https://cloudedjudgement.substack.com/p/clouded-judgement-62124-what-it-takes?utm_source=post-email-title&publication_id=56878&post_id=145617522&utm_campaign=email-post-title&isFreemail=true&r=1ll3r5&triedRedirect=true&utm_medium=email

What is the market telling us today? Those outer year long-term assumptions are a lot more unknown and uncertain today. And when uncertainty goes up, multiple goes down.

For these companies, their higher revenue multiples from the past never ended up making sense

All of this to say - not all software is created equal. There really should be A LOT of dispersion when it comes to revenue multiples. We can’t simply assume every cloud software company will eventually hit 20%+ FCF margins, and can grow 20% at scale. The last two years have made this abundantly clear.

The market today is simply saying “we don’t want to make assumptions about your profitability or growth at scale. We’ll pay the high multiple once the company is established and scaled.” The fact that 80% of the 20 highest revenue multiple companies have >$1B in revenue (and 100% of the top 10 are >$1B in revenue) shows this. IF you’re able to hit platform scale, and IF you can show FCF leverage, then and only then will you be rewarded with a premium multiple. For everyone else, they find themselves in a “prove it” stage (3~5x rev).

Link: https://cloudedjudgement.substack.com/p/clouded-judgement-62124-what-it-takes?utm_source=post-email-title&publication_id=56878&post_id=145617522&utm_campaign=email-post-title&isFreemail=true&r=1ll3r5&triedRedirect=true&utm_medium=email

OpenAI acquires Rockset (2024-06-24)

OpenAI announced Friday it was acquiring Rockset, “a leading real-time analytics database that provides world-class data indexing and querying capabilities.” (basically “serverless RAG”)

Rockset was founded in 2016 by two former software engineers at Facebook.

Rockset has raised $117 million in venture funding to date, according to Crunchbase, with Sequoia and Greylock investing in multiple rounds.

You are probably familiar with retrieval augmented generation (RAG) - It has quickly become the most popular technique for grounding AI model responses to corporate data.

Pinecone introduced a serverless RAG product in January 2024, along with claims of 50x cost savings. Existing vector store services typically charge users for peak compute capabilities whether or not they are using it. Serverless RAG only charges users for computing resources when queries are active and uses less memory for indexes.

The Rockset acquisition is related to a new phase related to data access and data ops - This phase is less about making the models better and more about improving the user output when AI foundation models are connected to enterprise data.

OpenAI has focused so far on delivering strong AI foundation models and has left the RAG work up to developers that integrated knowledge retrieval solutions. Rockset will provide additional in-house expertise and tooling to enable more capabilities directly and at a lower operating cost.

Link: https://open.substack.com/pub/synthedia/p/openai-acquires-rockset-and-highlights?utm_source=post-email-title&publication_id=1057898&post_id=145907998&utm_campaign=email-post-title&isFreemail=true&r=1ll3r5&token=eyJ1c2VyX2lkIjo5NjcyMjc1MywicG9zdF9pZCI6MTQ1OTA3OTk4LCJpYXQiOjE3MTkxMTU4NDksImV4cCI6MTcyMTcwNzg0OSwiaXNzIjoicHViLTEwNTc4OTgiLCJzdWIiOiJwb3N0LXJlYWN0aW9uIn0.vzvU3NbfHFnVPR4uunMsD5-2iQ18Ckyz_oWPqd2aS_E

End of Software (2024-06-23)

Thought-provoking article by Chris Paik of Pace Capital; received a lot of attention from silicon valley investors. TLDR below:

Before the internet, content creation was expensive; because it was expensive to create, it had to make money

When the internet happened, cost of content creation (UGC) and cost of distribution (e.g. Youtube) went to zero… and when content doesn’t cost anything to create, it no longer has to make money

The relaxation of this economic constraint led to a Cambrian explosion–you can take a picture of a cup of coffee, post it to a million views or none at all and the market clearing price is still met. This produced a deluge of content that none of us could reasonably consume.

These platforms completely T-boned media companies.

Software is expensive to create. You have to pay people to create it, maintain it, and distribute it. Because software is expensive to create, it has to make money. And we pay for it–software licenses, SaaS, per seat pricing, etc.

Software is expensive because developers are expensive. They are skilled translators–they translate human language into computer language and vice-versa.

LLMs have proven themselves to be remarkably efficient at this and will drive the cost of creating software to zero. What happens when software no longer has to make money? We will experience a Cambrian explosion of software, the same way we did with content.

Vogue wasn’t replaced by another fashion media company, it was replaced by 10,000 influencers. Salesforce will not be replaced by another monolithic CRM. It will be replaced by a constellation of things that dynamically serve the same intent and pain points.

Software companies will be replaced the same way media companies were, giving rise to a new set of platforms that control distribution.

Link: https://docs.google.com/document/d/103cGe8qixC7ZzFsRu5Ww2VEW5YgH9zQaiaqbBsZ1lcc/edit

Forget about LTV/CAC; IRR on CAC is all you need (2024-06-22)

All great late-stage companies are defined by one thing: their ‘go-to-market engine’ – their motion of acquiring (CAC), retaining, and upselling (Sales) customers

LTV to CAC, CAC payback time is misleading

Unlike LTV to CAC, yield adjusts for the most important principle in finance: time value of money.

While Company A may look better at first glance, Company B who receives payment upfront has higher Yield on CAC (refer to pic 1)

Line graph shows how cash balance differ over time with these strategies (refer to pic 2)

The relationship is simple and beautiful: a company’s maximum ‘cashflow-neutral’ growth rate is exactly equal to its yield on CAC

At a deeper level, using yield on CAC is the first step towards understanding your GTM engine as a separate business. Every growth-stage company is really two companies in disguise: an R&D and G&A machine, taking unstructured but high-reward risks that are paid for by your stable and existing customer base; and a GTM machine, consuming cash to acquire new customers in a structured, predictable, and high-yielding fashion.

Conclusion: Make sure you follow your Yield on CAC, and tailor your strategy as needed

Link: https://www.linkedin.com/pulse/yield-all-you-need-why-irr-cac-only-metric-matters-harry-elliott-m6yuc/

Jason 블로그 구독하기