作者:靖宇
「21 世紀最貴的是什麽?人才!」
多年前葛優在《天下無賊》裏台詞的含金量,還在不斷提升。
當地時間 6 月 10 日,媒體曝光 Meta 将以 149 億美元(折合人民币約 1066 億元)的價格收購 Scale AI 49% 的股權,而後者的聯合創始人 Alexandr Wang,将成爲 Meta 新成立的「超級智能小組」的掌門。
按照股權比推算,此次交易 Wang 和團隊有可能獲得 74 億美元,堪稱是矽谷成本最高的「挖角」——要知道,谷歌在 2014 年收購 DeepMind 團隊不過 6 億美元。
紮克伯格在内部信中寫道:「我們将共同構建 AI 的未來。」在 Llama 4 模型折戟、AI 團隊人員不斷流失的現實下, Meta 此次大舉押注 Scale AI,圖的是什麽?有了 Scale AI 和 Alexandr Wang,Meta 能在接下來的 AI 大戰中,重新找到自己的位置嗎 ?
01 最貴的「搖擺人」作爲 AI 時代矽谷蹿升最快的公司,Scale AI 的估值一直以火箭速度蹿升,短短 5 年時間就膨脹至 138 億美元。然而,此次 Meta 收購前者 49% 的股權,就需要付出 149 億美元的成本。
49% 顯然是爲了反壟斷審查考慮,但 Meta 和紮克伯格想要的,是聯合創始人之一 Alexandr Wang 這個人——這位 19 歲創業的天才将成爲 Meta 新成立的超級智能實驗室的負責人,帶領 Meta AI 進入新時代。
有意思的是,說 Meta 徹底買下 Wang 并不确切,因爲 Wang 将繼續擔任 Scale AI 的 CEO 一職,代表 Wang 和 Scale AI 還将繼續保持「獨立」 ,這可能也是曆史上成本最高的「腳踏兩隻船」,而 Scale AI 如果保持增長勢頭,Wang 則可能成爲矽谷身家增長最快的創業者,沒有之一。
紮克伯格如此急不可耐地、以 Meta 以罕見的金額出手押注 Scale AI 和 Wang,體現出的是他因 Meta 在 AI 競賽中逐漸掉隊的焦慮。
盡管 Meta 在 2024 年推出了參數規模達 1.8 萬億的 Llama 4 Behemoth,但其在多模态理解、長文本推理等關鍵指标上仍落後 GPT-4.5 約 12%。更尴尬的是,Llama 訓練數據的質量問題被曝光:業内估算約 30% 的語料來自低質量社交媒體内容,導緻模型頻繁輸出錯誤信息。
剛剛成立 2 年後的 Scale AI 團隊,最左側爲 Wang 本人|圖片來源:Scale AI
「 我們缺的不是算力,是幹淨的數據和頂尖工程人才 。」一位 Meta AI 研究員匿名吐槽。這解釋了爲何紮克伯格要砸重金請來 Wang——一個以數據标注技術聞名的「基建狂魔」。
作爲估值最高的數據标注公司,Scale AI 的蹿紅不是沒有道理。根據報道,Scale AI 的護城河在于其将原始數據轉化爲 AI 可用燃料的能力:#p#分頁标題#e#
軍事級标注精度:通過混合人類标注員+AI 質檢的「雙保險」,其數據錯誤率僅 0.3%,而行業平均爲 5%(公司自述)。
多模态數據壟斷:擁有全球最大的視頻動作标注庫(含 1.2 億條人體動作數據)和跨語言文本數據集(覆蓋 217 種語言)。
而事實上,花 149 億美元巨資買下「半個」Scale AI 和 Wang 本人,Meta 的野心不僅僅在于 AI 大模型本身。
02 轉型 AI 基建,彌補 B 端短闆數據、算力和模型,是大模型領域的三要素,Meta 作爲社交巨頭,在數據和算力上有着天然優勢,不過在「數據」上需要打個引号,因爲 Meta 的數據量雖然大,但如果質量不行,對于 AI 模型訓練作用不大。
「 你們看到的每個 GPT 回複,背後都有我們标注的 500 個數據點 。」Wang 的這句話,解釋了 Meta 的焦慮。當 OpenAI 用 Scale AI 的數據訓練出更聰明的模型時,Meta 卻困在自家社交數據的孤島裏。收購 Scale AI,等于直接接管了競争對手的「彈藥庫」。
Scale AI 手握全球 35% 的 AI 訓練數據流量,服務着從五角大樓到 OpenAI 的頂級客戶。Meta 研究院的工程師私下吐槽:「我們用 Llama 3 訓練時,30% 算力浪費在清洗垃圾數據上,而 Scale AI 的标注精度能達到 99.7%。」
有了 Scale AI 精準的數據清洗和标注,業内估計 Meta 将訓練數據污染率從 15% 降至 2%,下一代 Llama 5 的訓練周期縮短 40%。知情人士透露,正在測試的「Llama 5 Behemoth」參數規模達 3 萬億,專門用于攻克 AGI。
同時,Scale AI 的标注系統已深度适配 Meta 定制 AI 芯片架構,形成「數據标注-模型訓練-硬件優化」閉環,有可能使 Llama 模型推理成本降低至 GPT-4o 的 1/3。
可以說,引入 Scale AI 後,Meta 的 Llama 模型從訓練質量、效率和成本上都将獲得大幅優化。
事實上,Scale 的接入,甚至可能重塑 Meta 在 AI 競争中的整個戰略。相比于 Google 和微軟,缺少雲計算平台的 Meta 一直隻能在 C 端撒野。而有了 Scale 的能力, Meta 計劃通過 AWS/Azure 等雲平台對外提供 Scale AI 數據服務,構建類似微軟「Copilot+OpenAI」的生态閉環,将競争對手轉化爲客戶 。
如果說數據是新時代的石油,那麽 Meta 通過購買 Scale AI 這家份額最大的「數據精煉廠」,已經掌握了大半個 AI 基建體系。
Meta 在 AI 競争中逐漸掉隊|圖片來源:Meta
當然,OpenAI、Anthropic 等競争對手到底會不會買賬目前仍未可知,雖然 Meta 僅僅買下半個 Scale AI(和半個 Wang),但顯然已經足夠讓前者警惕 Scale AI 的中立地位,所以 openAI 也在加緊和 Scale AI 的競争對手 Handshake 合作。
不過,鑒于 Scale AI 在數據标注方面的壓倒性優勢,OpenAI 等公司要想馬上和 Scale AI 斷聯,也不太現實。至少在短期内,AI 巨頭們依然需要 Scale AI 的服務。#p#分頁标題#e#
即便 Scale AI 之前的客戶們逐漸減少下單,Meta 和 Scale AI 已經謀劃新的收入來源——政府和國防客戶。根據報道,Scale AI 合作,已經獲得來自美軍方超過 2 億美元的政府訂單。同時,Scale AI 本身也在向國防定制等垂直領域的 AI 應用層擴展,而 Meta 的企業級銷售能力和背書,無疑會對 Scale AI 未來的發展提供足夠動力。
業内人士傳言,Meta 和 Scale AI 的巨額交易還有一個隐藏對賭:若 Scale AI 未來三年收入增速低于 80%,Meta 有權以折扣價收購剩餘股份 ——這代表 Wang 不僅要「讓 Meta AI 再次偉大」,同時自己的 Scale AI 在收入上也要繼續高速增長。而 B 端業務顯然會成爲雙方的新增速來源。
對于 Meta 團隊,Wang 即便作爲「腳踏兩隻船」的超級智能實驗室負責人加入,也能産生極強的「鲶魚效應」。在矽谷 AI 界,Meta 向來以學術氛圍濃厚著稱,Llama 的開源和普惠正是其學術思考的結果。但 Wang 極力推崇的「數據思維」無疑将對 Meta 現有的 AI 團隊産生沖擊和改變。
根據媒體報道,Wang 剛剛加入 Meta,反手就砍掉三個學術項目,推動團隊向更「現實」的方向轉型。
如果不考慮反壟斷的阻撓,此次 Meta 對于 Scale AI 和 Wang 本人的巨額押注,可能重塑 Meta 在激烈的 AI 競争中的角色和發展方向,不僅讓 Meta 快速縮短和競争對手在模型領域的差距,更能使這個社交巨頭,完成從應用到 AI 基建角色的轉變。
這場豪賭的本質,是 Meta 試圖用資本力量重寫 AI 競争規則。正如矽谷分析師 Sarah Guo 所言:「當所有人都在造車時,Meta 買下了整條高速公路——不管車上坐的是誰,都得交過路費。」