擰巴的扎克伯格
出品 | 虎嗅科技組
作者 | 房曉楠
編輯 | 苗正卿
頭圖 | 視覺(jué)中國(guó)
無(wú)疑,這幾天AI圈最大的流量都被Meta承包了。
先是4月6日,遲遲不出手的Meta終于亮相,一舉扔出包括Llama 4 Scout( 109B )、Llama 4 Maverick ( 400B )和Llama 4 Behemoth在內(nèi)的Llama 4套餐,憑借“原生多模態(tài)MoE架構(gòu)”“性能超越DeepSeek V3”“1000萬(wàn)token上下文”等亮點(diǎn),一路高舉高打。業(yè)界也是喜聞樂(lè)見(jiàn),“開(kāi)源之光依舊能打”等聲音持續(xù)不斷,Llama 4出道即巔峰。
但沒(méi)想到,緊接著負(fù)面聲音層出不窮。
一方面,開(kāi)發(fā)者在實(shí)際測(cè)評(píng)時(shí)發(fā)現(xiàn),Llama 4的性能并沒(méi)有官方宣揚(yáng)的那樣強(qiáng)大,甚至在代碼、邏輯推理方面,遠(yuǎn)不如GPT-4o、DeepSeek R1 、 Gemini 2.5 pro。
另一方面,有自稱Meta內(nèi)部員工的人員爆料,Llama 4存在造假嫌疑,為了“趕工期”,在后訓(xùn)練階段中,將多個(gè)benchmark測(cè)試集混入訓(xùn)練數(shù)據(jù),以提升基準(zhǔn)分?jǐn)?shù)。甚至,技術(shù)負(fù)責(zé)人看不過(guò)去這樣的造假行為,遞交辭職報(bào)告。傳聞一出,立即發(fā)酵,Meta陷入輿論風(fēng)波中,各種聲討聲不斷。
一位大模型從業(yè)者在朋友圈發(fā)文稱,“Meta的‘作弊’行為,讓他想到2023年百模大戰(zhàn)時(shí)期。”另有業(yè)內(nèi)人士認(rèn)為大模型和芯片不一樣,一味追求跑分榜單意義不大,大模型的核心能力還是要放到業(yè)務(wù)場(chǎng)景中實(shí)戰(zhàn)。
而經(jīng)過(guò)一夜的輿論發(fā)酵,目前,Meta官方已正式做出回應(yīng),Llama 4不存在造假、打榜等行為,模型質(zhì)量表現(xiàn)不一,是有充足的理由可以解釋的,即“我們?cè)谀P鸵粶?zhǔn)備好就立即發(fā)布了,所以預(yù)計(jì)在各個(gè)平臺(tái)的公開(kāi)實(shí)現(xiàn)需要幾天時(shí)間才能完全穩(wěn)定下來(lái)”。
之后,Meta首席AI科學(xué)家Yann LeCun也轉(zhuǎn)發(fā)澄清貼,表明Meta并不存在造假行為。
但是這番解釋并沒(méi)有讓大家信服,根據(jù)澄清文,緊跟而來(lái)的疑點(diǎn)是,“如果模型還沒(méi)有穩(wěn)定下來(lái),Meta為何急著發(fā)布?”
其實(shí),關(guān)于這一點(diǎn),答案很明顯,Meta急了。
在Llama 4發(fā)布之前,Meta上一次發(fā)布新品還是在去年7月,發(fā)布Llama 3.1 405B模型,彼時(shí)DeepSeek仍處于蟄伏期,Meta風(fēng)光無(wú)限,CEO扎克伯格也高調(diào)預(yù)告著已經(jīng)處于開(kāi)發(fā)中的Llama 4。
只是沒(méi)想到,今年年初,DeepSeek憑借強(qiáng)大的多場(chǎng)景理解與內(nèi)容生成能力成功“出圈”,AI圈的競(jìng)爭(zhēng)格局瞬間改變,壓力給到一眾大模型企業(yè),Meta自然也不例外。有消息稱,當(dāng)時(shí)Meta就意識(shí)到,相較于DeepSeek-V3,研發(fā)中的Llama 4 在各項(xiàng)測(cè)試中都比不過(guò)前者,于是研發(fā)進(jìn)程一再被打亂。
一位業(yè)內(nèi)人士告訴虎嗅,相傳DeepSeek出來(lái)后,Meta便在內(nèi)部設(shè)置了四個(gè)作戰(zhàn)室,天天研究DeepSeek,思考該如何復(fù)現(xiàn)其模型能力。另外,這次Meta首次在Llama系列模型中采用MoE架構(gòu),或許也是出于這一路徑早已被DeepSeek驗(yàn)證過(guò)。
但顯然,Llama 4的性能表現(xiàn)并沒(méi)有達(dá)到預(yù)期,即便是大手筆地用了20萬(wàn)的顯卡集群。
其實(shí),或許Meta的壓力要來(lái)得更早一些。
在Llama 4 造假傳聞出來(lái)后,虎嗅在向業(yè)內(nèi)人士求證的過(guò)程中,得到的反饋大都是,“這很正常,Meta被逼急了,就只能去作弊了?!?/p>
一位業(yè)內(nèi)人士告訴虎嗅,Llama的危機(jī)感并不是完全是因?yàn)槟瓿鮀eepSeek出現(xiàn)才有的,這只是加速了這一認(rèn)知,其實(shí)早從去年下半年開(kāi)始,在開(kāi)源上,Llama系列模型的影響力就大不如前了,開(kāi)發(fā)者早早就達(dá)成一致,轉(zhuǎn)向性能表現(xiàn)更好的Qwen系列和DeepSeek。
所以,在這次Llama 4發(fā)布之際,大家更多是抱著Meta將帶來(lái)怎樣的提升與改進(jìn),并非期待它真的能夠顛覆DeepSeek,重新翻盤(pán)。
只是沒(méi)想到,Meta不僅沒(méi)有讓大家看到它的進(jìn)步,更是因?yàn)橐恍懊曰蟆辈僮?,讓自己深陷造假風(fēng)波。
而最新消息是,目前在社區(qū)內(nèi)還有一些開(kāi)發(fā)者在繼續(xù)試圖找出Meta造假的證據(jù)。
其實(shí),不管這次Meta造假與否,已經(jīng)沒(méi)那么重要了,重點(diǎn)是,Llama系列模型已經(jīng)無(wú)法再現(xiàn)昔日榮光是真的,Meta面臨著巨大的信任危機(jī)是真的。如果說(shuō)之前,Meta的壓力與挑戰(zhàn)還在于如何應(yīng)對(duì)DeepSeek和Qwen帶來(lái)的沖擊,那么現(xiàn)在,如何針對(duì)Llama 4 存在的性能缺陷,早點(diǎn)修復(fù)Bug,重新奪回起開(kāi)發(fā)者的信任,才是更為迫切的難題。
原本,這只是AI圈一場(chǎng)事先張揚(yáng)的新品發(fā)布,沒(méi)想到卻一波三折,最終演變成一場(chǎng)“鬧劇”,可想而知,這早已背離Meta的初衷。
不知道看到這樣的結(jié)果,Meta是否會(huì)后悔,反正已經(jīng)晚了,又何必在乎再晚一點(diǎn),面對(duì)DeepSeek這樣橫空出世的“大魔王”,焦慮是正常的,如果老老實(shí)實(shí)交出一份誠(chéng)心之作,即便再不如意,也不會(huì)像如今這般“慘淡收?qǐng)觥薄?/p>
文章標(biāo)題:擰巴的扎克伯格
文章鏈接:https://www.huxiu.com/article/4216259.html
閱讀原文:擰巴的扎克伯格_虎嗅網(wǎng)