2025 年 11 月,姚順雨穿著休閑短褲、踩著拖鞋出現(xiàn)在騰訊的一場內(nèi)部會上。這位 27 歲的 OpenAI 前研究員、提出過 ReAct 范式的技術(shù)天才剛被騰訊以重金招入麾下不久。
入職后,他的一項重要任務(wù)是幫騰訊找到混元大模型長期表現(xiàn)欠佳的原因,并將情況直接上報給集團總裁劉熾平;姚順雨細致地檢查每一個環(huán)節(jié),不時和同事、實習生交流至半夜——這些是他的前任們很少會做的。很快他成為了騰訊大語言模型的一號位。
“混元的評測出了大問題。” 一位在場人士轉(zhuǎn)述姚順雨在會上發(fā)言,意思是模型過度追逐在榜單上的成績,將打榜的語料放入訓練集以致數(shù)據(jù)被污染,盡管模型很會答題,在真實場景里的表現(xiàn)卻不穩(wěn)定。他希望團隊以后不要打榜,也不要盯著榜單做事。會上,混元的相關(guān)負責人也提到了模型過去在數(shù)據(jù)、預訓練、infra 上的問題。
過去兩年多,這家中國市值最高、掌握著最大流量入口的互聯(lián)網(wǎng)公司,在 AI 上的節(jié)奏相對謹慎——無論是投入力度,還是組織與產(chǎn)品推進速度,都落后于阿里巴巴與字節(jié)跳動。直到 2025 年,這種狀態(tài)開始改變:高薪招攬技術(shù)人才、大規(guī)模重組模型與 AI 產(chǎn)品團隊、持續(xù)向 “元寶” 傾斜資源。姚順雨的到來,成為這一系列變化中最明確的拐點。
“把以前的節(jié)奏和慣性徹底打亂,才是回到正軌的第一步。” 一位混元大模型人士說。
騰訊在重振旗鼓,阿里則想試圖定義 AI 敘事。
阿里提出了一個新概念:通云哥——通義實驗室、阿里云與平頭哥,即 AI、云計算和芯片三位一體發(fā)展。阿里認為自己是中國為數(shù)不多擁有全棧式 AI 能力——從芯片、大模型、云服務(wù)到產(chǎn)品的科技公司。這也是 Google 講的故事。
三大互聯(lián)網(wǎng)巨頭中,阿里的主業(yè)賺錢效率最低。據(jù)報道,今年前三季度字節(jié)跳動的凈利潤在 400 億美元左右;同期,騰訊與阿里的凈利潤為 300 億美與 100 億美元左右(自然年口徑)。但這沒有影響它投入的決心。
一位知情人士透露,阿里正考慮將未來三年投入到 AI 基建與云計算上的 3800 億元提升至 4800 億。在國內(nèi),阿里有自研的芯片真武 810E;在海外,它也在 “用一輛輛卡車來運采購的 GPU。” 一位知情人士說。最激進的時候,“連 RTX 4090 這類消費級顯卡也大量買入,用來搭建推理集群、補充推理吞吐。”
2025 年 12 月,千問 App、螞蟻旗下的靈光、阿福每天的拉新投放費用都在 1000 萬元以上;千問 App 的單日投放峰值一度達到 1500 萬元。
對字節(jié)跳動來說,“AI 是一件能影響整個世界的機會。” 一位接近字節(jié)跳動高層人士說。從 TopBuzz、TikTok 到 TikTok Shop,成立以后這家公司一直在尋找這樣的機會,“越接近世界中心的事情探索價值才越大。”
相比騰訊與阿里分別在模型與產(chǎn)品上有劣勢,字節(jié)跳動的能力更綜合。豆包在 2025 年底成為了國內(nèi)第一個日活躍用戶數(shù)破億的 AI 產(chǎn)品;豆包大模型的日均 Token 處理量達到 63 萬億,半年增長超 200%。
2023 年,字節(jié)跳動創(chuàng)始人張一鳴曾說,當下這個時代的操作系統(tǒng)級機會就是 AI + 計算。
2026 年字節(jié)會全面加速 AI 業(yè)務(wù)的全球化,東南亞等地區(qū)是重點,美國暫時不會進入。據(jù)了解,字節(jié)的目標是在大模型上至少成為全球第三。截至 2025 年底,豆包的海外版本 Dola 全球日活躍用戶數(shù)突破 1000 萬。
中國的這一輪大模型熱潮始于 2023 年。在明星創(chuàng)業(yè)公司最受關(guān)注的早期階段,互聯(lián)網(wǎng)巨頭們并不算顯眼。三家選擇了不同的路徑:騰訊更重視 AI 的應用落地,因此相對低調(diào)地等待模型能力成熟;阿里將大模型推向開源,押注于做大生態(tài),從而為云業(yè)務(wù)打開增量空間;字節(jié)跳動起步較晚,只能通過飽和式投入,盡快補齊技術(shù)短板。
直到 2025 年初, DeepSeek 為整個行業(yè)重新畫了一條起跑線,巨頭活躍了起來,戰(zhàn)場有了硝煙的味道。
2026 年春節(jié)成為了這場戰(zhàn)爭的引爆點。