虎嗅對話李開復:最初的核心聯創團隊基本沒變
在海淀區毗鄰北京大學的零一萬物辦公區中,員工依然忙忙碌碌,仿佛并沒有受到外界輿論風波的影響。
?
?
是什么契機讓李開復重新思考預訓練?從什么時候開始暫停對超大模型的追求?做出了什么影響公司命運的關鍵決擇?
?
面對虎嗅的靈魂拷問,他依舊保持一貫的溫文爾雅,絲毫沒有回避外界關心的焦點,并分享了他做出轉變的心路歷程。
?
雖然在外界看來零一萬物的轉變有些突然,但對李開復和零一萬物來說這是一次有章法有節奏的“變道”,甚至在半年前就開始長線布局。
?
以下是虎嗅與李開復溝通實錄:
?
虎嗅:零一萬物內部的決策模式是怎樣的?比如你是更樂于和大家商量?還是你更相信自己的預判?
?
李開復 :在我創業之初,就集結了一批“愿意相信我,我也很信任他們”的創始團隊。谷雪梅、馬杰、祁瑞峰、Anita等,這些人從一開始就在我的聯創團隊里, 最初的核心聯創團隊基本上沒有改變 ,還有約20位勤奮強悍的干將。
?
我們因為同樣信仰AGI,同時也勇于腳踏實地地擁抱應用落地和商業化,所以我們走到一起來。即使在充滿壓力的狀況下,任何同事都可以跟我約一對一的時間,我們固定舉辦開誠布公無話不說的TGIF全員溝通會,每個重要決策從判斷到落地,必定是我們達成共識的結果。
?
虎嗅:你什么時候開始對預訓練有新的思考?有什么關鍵節點,是你思考這件事的契機嗎?
?
李開復 :大模型賽道技術迭代特別快,所以必須做超前預判和布局。在 2024 年 5 月的時候,我們就開始思考預訓練的路線問題。在 2024 年 5 月,我們發布了一個千億參數模型 Yi-Large,當時 Yi-Large 的模型表現很好,在國際權威盲測榜單 LMSYS Chatbot Arena 總榜上取得了當時世界第七、中國第一的成績。但是從現在往回看, Yi-Large 在模型推理速度和推理成本優化方面,還有相當大的提升空間。
?
原本我們模型路線圖上的下一個版本是更大尺寸的 Yi-X-Large,仍然走稠密模型、需要加倍的卡才能做到的路線。 當時我們就面臨著一個抉擇,是繼續沿著 Scaling Law,用更多的 GPU、更多的數據去訓練更大參數規模的模型,還是說我們要采更務實的路線,去專注于做更輕量化、但是模型性能依然能保持領先的模型?
?
我們內部在半年多前就意識到了 Scaling Law 的邊際收益遞減,對初創公司最直接的就是財務影響,我的財務同事每幾周跟我過現金流,看到算力一個月一個月的支出,真不是可持續的方式。賭上巨量資源去訓練超大參數規模的模型,超低的性價比對初創公司來說,肯定不是一個務實的選擇。
?
那次的關鍵技術決策討論是個節點,經過很多實驗后我們決定換一個路線,去年10月零一萬物推出的新旗艦模型 Yi-Lightning 是我們一次嘗試,Yi-Lightning 采取MoE(混合專家)架構,激活參數僅20多B,但模型表現更出色——模型性能上超過了 2024 年 5 月版本的 GPT-4o,發布時在 LMSYS 上排名世界第六、中國第一(2024 年 10 月 16 日數據)。更重要的是,Yi-Lightning 的模型訓練成本僅350萬美元,僅是 GPT-4o 的 1/30,我們的推理成本做到行業最低,喊出大模型也能有“白菜價”。
?
從去年下半年,我們開始暫停對超大參數規模的模型的追求,回頭復盤,真是還好沒加那多幾千卡的成本。
?
虎嗅:當你意識到這件事情后,你當時做的第一個決定是什么?你如何去推動公司內部接受這個認知,并參與到這個轉型之中?
?
李開復 :有了前面提到的這個放棄 X-Large 的轉變和驗證,公司內部也很快都達成了共識。因為作為親身經歷者,我們每個人都看到了,跟AI 1.0時代不一樣,AI 2.0時代大模型技術和產業發展都是被加速的。大模型公司融到了更多資源,但是也因為大模型預訓練投入更大的資源。從技術上看,僅僅一年多的時間,引領大模型前進的傳統 Scaling Law 邊際收益遞減明顯,商業化上同樣如此,我參與過 AI 1.0 時代的投資和孵化,一家公司獲得商業化的成功可能有5到8年窗口,相比之下,大模型賽道一切加速,AI 2.0 大模型公司會更快地面臨商業模式的靈魂拷問。
?
在當下的階段,聚焦“小而美且便宜”的模型,在此之上加速應用落地和商業變現,不論是在技術角度,還是在商業角度,都更實際、更負責,也是更健康、更能走下去的選擇。
?
虎嗅:這個轉型中最大的挑戰來自什么?
?
李開復 :可能外界觀感是零一萬物轉型調整來得突然,但是我們從去年第二季度開始針對技術路線進行復盤,第三季度開始嘗試構建輕量化模型 10 月推出了Yi-Lightning,同時積極在 ToC 和 ToB 領域探索落地,11月份我們首度公布了 ToB 戰略,再到 2025 年年初宣布與阿里云成立產業大模型聯合實驗室,你可以看到, 這一切調整都是基于長線戰略調整循序漸進、一脈相承的。只是近期一些噪音和歪曲解讀突然出現,讓我們有章法有節奏的布局對外界顯得有些突然。
?
歷史上許多新的技術過了黑科技發明期,面臨技術落地和產品化的時候,沒能獲得商業的成功,這個階段被稱為“創新死亡谷”。零一萬物已經證實了我們能做世界級的技術,是時候要關注和聚焦模型能力的落地實現,運轉出能良性造血的商業模式。
?
更確切地說, 行業正在集體穿越大模型時代的“創新死亡谷” 。
?
最大的挑戰在于有限的資源、有限的時間。行業對 Scaling Law 從追捧到懷疑就不到一年的時間,我們如何在時間表里制定計劃、保持敏捷,在有限的資源里最大化我們的執行力。我們必須以快打快,不進則退。
?
虎嗅:圈內有些公司在做ToB業務同時仍然在做預訓練,你如何看待?
?
李開復 :如果一家創業公司的長板足夠長,不管你的長板是在模型上還是產品上,都可以一定程度上回答所謂的靈魂拷問。我在這里不點評其他家的做法,我相信大家都能夠找到專屬于自己的道路。
?
對于零一萬物而言,我們的長板就是能夠在保證模型性能處于世界第一梯隊的同時,大幅降低訓練和推理成本、大幅提升推理速度。 大模型公司第一年在前期科研、模型訓練方面需要花費巨量的資源,狂奔進入第二年后,初創公司更應該有一個符合商業邏輯、對投資人負責、能確保活下來的商業模式。
?
虎嗅:在ToB這件事情上,你認為零一萬物最本質的競爭力在哪幾個維度?這幾個維度在你心中它的排列順序該是什么樣的?
?
李開復 :首先,在經過一年多的技術沉淀,零一萬物已經具備了世界第一梯隊的技術能力,證明了自己能夠交付出性能世界領先的模型。我們技術底子夠硬。
?
其次,在尋找落地場景這件事上,我們不像其他 AI 公司能夠雇傭數百個銷售。但我本人以及聯創團隊都有著豐富的人脈資源,使得零一萬物能夠從開始就切入重點領域內的頭部公司,快速找到適合凝練出標準化 ToB 解決方案的領域和場景。
?
第三,零一萬物還可以跟創新工場聯動。創新工場投資的很多領域的公司,比如 AI 制造、 AI 金融、 AI for Science、具身智能、無人駕駛等等,跟我們都是非常互補的,都可以在行業大模型方面展開合作。
?
創辦零一萬物的最初目標是在實現我的 AGI 夢想同時取得商業上的成功,我們要做的是要讓頂尖大模型能力走出實驗室,去進行產業落地,打造AI-First產業應用,把技術超能力變成“鈔能力”,創造實質的商業價值,才能面對最后的靈魂拷問:你到底能不能把技術轉換成商業價值?先有收入,再增加收入,然后收窄虧損,最終從單點盈利到多點持續盈利。
?
虎嗅:你認為2025年在 ToB 業務上,真正考驗每家公司的焦點能力是什么?這種情況下我們如何保持自己的競爭優勢?
?
李開復 :2025 年是 AI-First 應用爆發的元年,中國有望在應用元年彎道超車,零一萬物必須提前卡位。
?
大模型 ToB 行業的挑戰是,客戶和技術提供商不是雙贏,而是一方壓價,另一方因為沒有利潤只能隨便做做。對于大模型公司來說,很大一部分的 ToB 合作客戶付費意愿不高,服務場景也很難做成可復制化的產品。這就會變成惡性循環:大模型公司沒辦法全身心投入,客戶也沒辦法從解決方案中獲得業績增長,最后大家都賺不到錢。
?
在零一萬物看來,有三種 ToB 的方向是值得嘗試的。一種是能夠為客戶創造核心價值的,不僅能省錢,更重要的是能夠幫助客戶做增長。比如零一萬物的如意數字人和萬視營銷短視頻;第二種是在一些特別垂直、又很適合大模型落地的領域,與真正有遠見、有決心擁抱大模型的公司一起共創,打造行業大模型。基于目前為人熟知的金融、醫療等領域,零一萬物會再向下挖掘更垂直的行業,在這些垂直行業里,行業龍頭可能會因為大模型而產生營業額的快速增長。這類企業每個都是金礦,我們已經有了一些嘗試。第三就是服務可復制、可快速規模化的領域,服務第一個客戶時可能不賺錢,但相似的產品可以服務很多家同類型的客戶。
?
目前,在國內 ToB 方向上,零一萬物在游戲、能源、汽車、金融領域都在談千萬以上的單子,而且基本都是軟件單。下一個階段零一萬物會繼續放大這些領域,也會進入有機會的新領域。如果能結合對方的行業 Know-how、數據和零一萬物的技術,比如以共同設立合資公司的形式,一起做細分的行業模型和更好的行業解決方案,就能創造更多價值。 我有把握,在 2025 年能有數倍收入增長,從 1 億做到數億。
?
(Tips:我是虎嗅科技醫療組的王欣,關注AI及創投領域,行業人士交流可加微信:13206438539,請注明身份。)