對(duì)標(biāo)25億美元估值獨(dú)角獸,這家具身智能公司被阿里、美團(tuán)重投
作者|向欣
阿里和美團(tuán),罕見地同時(shí)在同一輪融資中投了一家具身智能公司。
9 月 8 日,自變量機(jī)器人宣布完成近 10 億元 A+輪融資,阿里云、國(guó)科投資領(lǐng)投,國(guó)開金融、紅杉中國(guó)、渶策資本跟投,老股東美團(tuán)、聯(lián)想之星、君聯(lián)資本追投。
這是阿里云首次投資具身智能公司,也是美團(tuán)第二次參與自變量機(jī)器人的融資。
此前,自變量機(jī)器人已完成 7 輪融資,據(jù) CNBC 報(bào)道,自變量機(jī)器人總?cè)谫Y額達(dá)到 2.8 億美元(約合人民幣 20 億元)。
自變量機(jī)器人成立于 2023 年底。它的鮮明特征有兩點(diǎn):
其一,從一開始就堅(jiān)持走端到端的具身通用大模型路線,而不是分層模型或?qū)S眯∧P,直接?duì)標(biāo)美國(guó)估值 24 億美元的 Physical Intelligence(PI);
其二,屬于「真機(jī)數(shù)據(jù)派」,相比一味追求數(shù)據(jù)規(guī)模和多樣性,更重視數(shù)據(jù)質(zhì)量。
就在宣布融資的同一天,自變量還開源了具身智能大模型「Wall-OSS」,該模型在多個(gè)維度上對(duì)標(biāo)并超越了π0 模型(PI 研發(fā)的具身大模型)。
在不久前的 WRC 上,自變量機(jī)器人將自研的 WALL-A 模型部署到「小量」機(jī)器人身上,實(shí)現(xiàn)了自主制作香囊、整理客廳等復(fù)雜任務(wù)。
目前行業(yè)中,不少企業(yè)傾向采用分層模型來解決具身智能的部分操作任務(wù),因?yàn)檫@種方式對(duì)數(shù)據(jù)需求更低,由于模塊化的設(shè)計(jì),可控性更強(qiáng),還能針對(duì)特定任務(wù)做優(yōu)化。
完全的端到端模型,則被視為更長(zhǎng)遠(yuǎn)的技術(shù)范式——它能在統(tǒng)一架構(gòu)下解決復(fù)雜任務(wù),但目前技術(shù)條件下難度極高。
自變量選擇的正是這條「終局之路」:打造具備強(qiáng)泛化能力的通用基礎(chǔ)模型。
這條路線需要更高的技術(shù)門檻和更長(zhǎng)的資本耐力,但資本市場(chǎng)的密集押注,顯示它正在獲得越來越多的認(rèn)可與信任。
與此同時(shí),經(jīng)過今年的一番密集投資,阿里、美團(tuán)、京東三大巨頭在具身智能領(lǐng)域的暗戰(zhàn)持續(xù)升溫,各自的布局邏輯已出現(xiàn)分化,勾勒出清晰、差異化的競(jìng)爭(zhēng)格局。
端到端模型是唯一解
自變量機(jī)器人最初專注具身大模型,隨后擴(kuò)展到大模型與本體協(xié)同發(fā)展的全棧布局,是典型的「軟硬兼修」路徑。公司核心團(tuán)隊(duì)擁有北大、清華「雙核」背景。
創(chuàng)始人兼 CEO 王潛,本碩畢業(yè)于清華大學(xué),是全球最早在神經(jīng)網(wǎng)絡(luò)中提出注意力機(jī)制的研究者之一。
攻讀南加大博士期間,他在美國(guó)頂級(jí)機(jī)器人實(shí)驗(yàn)室參與了機(jī)器人操作與家庭服務(wù)機(jī)器人相關(guān)的多個(gè)研究項(xiàng)目,幾乎涵蓋了該領(lǐng)域的所有主流方向。
王潛
聯(lián)合創(chuàng)始人兼 CTO 王昊,是北大計(jì)算物理博士,曾任粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院(IDEA 研究院)大模型團(tuán)隊(duì)負(fù)責(zé)人,主導(dǎo)的開源模型下載量超過百萬。
簡(jiǎn)單來說,王潛對(duì)機(jī)器人操作有深厚積累,王昊深耕大模型,兩者在技術(shù)上互補(bǔ)。
不過,王昊也評(píng)價(jià)王潛是「既懂機(jī)器人,又懂大模型」的少見復(fù)合型人才。
兩人共同確立了自變量的技術(shù)方向:端到端模型 + 真機(jī)數(shù)據(jù)。
早在 2016 年,王潛就判斷端到端是解決具身操作問題的必由之路,開始著手研發(fā)端到端的機(jī)器人模型。
那時(shí),這個(gè)觀點(diǎn)并不被主流認(rèn)可,甚至有知名的機(jī)器人學(xué)者直接對(duì)王潛否定了這一技術(shù)路線。
但隨著 ChatGPT 和特斯拉 FSD 的出現(xiàn),端到端路線逐漸成為業(yè)內(nèi)共識(shí)。
在王潛看來,具身智能的難點(diǎn)在于物理交互的復(fù)雜性。分層模型每多一步拆解,就會(huì)引入額外誤差和不可控的噪聲,難以實(shí)現(xiàn)真正可靠地執(zhí)行;而端到端統(tǒng)一模型,能夠在「感知—決策—執(zhí)行」的全流程中保持連續(xù)性,從根本上解決這一問題。
從 2020 年起,他進(jìn)一步提出「統(tǒng)一模型」思路:用一個(gè)模型整合多模態(tài)信息,解決多類任務(wù),可以理解為「通用基礎(chǔ)模型」。
這正是自變量 WALL-A 模型的核心設(shè)計(jì)。這種端到端與統(tǒng)一體現(xiàn)在兩個(gè)維度:
縱向統(tǒng)一:從視頻、傳感器等原始輸入到機(jī)器人運(yùn)動(dòng)輸出,全部由同一模型處理,避免分層帶來的累積誤差。
橫向統(tǒng)一:不同任務(wù)共用同一個(gè)模型,訓(xùn)練和推理都在同一架構(gòu)下完成,具備跨任務(wù)遷移能力。
自變量的代表性成果 WALL-A 具身模型,已經(jīng)能在低成本硬件上完成諸如拉拉鏈、扣扣子、整理衣物等高難度任務(wù),成功率達(dá) 90% 以上。
對(duì)人類而言,這些是日常動(dòng)作,但對(duì)機(jī)器人來說卻極其復(fù)雜:涉及柔性物體、隨機(jī)性和復(fù)雜拓?fù)浣Y(jié)構(gòu),每一步的預(yù)測(cè)難度都非常高,需要高度精準(zhǔn)的操作和動(dòng)態(tài)調(diào)整。
而在通用性、泛化層面,WALL-A 可以做到使用極少的樣本,完成各種物理環(huán)境變量、動(dòng)作模式的泛化和遷移,并且已在部分完全未訓(xùn)練過的新任務(wù)類型中展現(xiàn)出零樣本泛化能力。
零樣本泛化能力,正是具身智能機(jī)器人走向通用的標(biāo)志性技術(shù)壁壘。
它意味著機(jī)器人無需針對(duì)新任務(wù)重新訓(xùn)練,僅靠現(xiàn)有認(rèn)知就能適配未知場(chǎng)景,有了用有限的數(shù)據(jù)量做無限種類的任務(wù)的可能性,解決機(jī)器人發(fā)展的最大難題——數(shù)據(jù)不足的問題。
數(shù)據(jù)質(zhì)量遠(yuǎn)比規(guī)模和多樣性重要
在模型路線的選擇上,自變量的另一大堅(jiān)持是:高質(zhì)量真機(jī)數(shù)據(jù)。
分層模型依賴人類先驗(yàn)知識(shí)分解任務(wù),各模塊目標(biāo)明確,數(shù)據(jù)需求相對(duì)較低。
而端到端模型像一個(gè)「黑箱」,直接從原始輸入學(xué)習(xí)到最終輸出,不依賴人工拆解。這種模式對(duì)數(shù)據(jù)的規(guī)模、質(zhì)量和多樣性提出了更高要求。
王昊的經(jīng)驗(yàn)在此發(fā)揮了關(guān)鍵作用。他是國(guó)內(nèi)最早做大模型研發(fā)的一批人,曾主導(dǎo)國(guó)內(nèi)首個(gè)百億級(jí)大模型和早期千億級(jí)模型之一「Ziya」。
他發(fā)現(xiàn),靠數(shù)據(jù)規(guī)模堆起來的大模型,并沒有明顯的「大力出奇跡」的效果。
ChatGPT 誕生后,早期大家試圖僅靠堆砌大量數(shù)據(jù)來復(fù)刻 ChatGPT,但都失敗了;直到有人用 ChatGPT 的數(shù)據(jù)來「微調(diào)」模型,才第一次做出了可用的大模型。
因此,自變量在數(shù)據(jù)策略上,強(qiáng)調(diào)質(zhì)量?jī)?yōu)先于數(shù)量和多樣性。
自變量的訓(xùn)練數(shù)據(jù)主要來自現(xiàn)實(shí)生活中的真機(jī)采集,包括集中式數(shù)據(jù)采集場(chǎng)地、分布式現(xiàn)實(shí)環(huán)境收集,以及機(jī)器人部署后的回流數(shù)據(jù)。同時(shí)也會(huì)使用廣泛的互聯(lián)網(wǎng)視頻數(shù)據(jù)做預(yù)訓(xùn)練。復(fù)雜的物理交互環(huán)節(jié)(如精細(xì)手部操作),則完全不用仿真數(shù)據(jù)。
在高質(zhì)量數(shù)據(jù)驅(qū)動(dòng)下,自變量的模型展現(xiàn)出較強(qiáng)的泛化能力。
王潛將泛化劃分為四個(gè)層次:
1、基礎(chǔ)條件的泛化:適應(yīng)光照、物體位置等同一任務(wù)、環(huán)境下的基礎(chǔ)條件變化;
2、跨環(huán)境的泛化:能從一個(gè)場(chǎng)景(如桌面)擴(kuò)展到不同場(chǎng)景(如廚房臺(tái)面);
3、對(duì)象層面的泛化:對(duì)同類但未見過的全新物體(例如不同種類的杯子),依然能完成任務(wù);
4、任務(wù)的泛化:對(duì)于完全未學(xué)習(xí)過的任務(wù),具備探索和解決的能力。
王潛稱,目前他們的模型在前三個(gè)層面都體現(xiàn)出了很好的通用性、泛化性能力,基本意味著可以在一個(gè)半封閉的或者是一個(gè)半開放的場(chǎng)景里去替代掉很多繁瑣的體力勞動(dòng),具備商業(yè)落地的可能性。
在商業(yè)化上,自變量的規(guī)劃是先從 To B 場(chǎng)景切入,逐步延展至 To C。
目前除大模型外,自變量還推出了輪式雙臂仿人形機(jī)器人「量子 2 號(hào)」,全身 62 個(gè)自由度,能夠覆蓋 0-2 米的工作空間,靈活應(yīng)對(duì)家務(wù)、物流等復(fù)雜任務(wù)。
三大電商巨頭的具身智能暗戰(zhàn)
自變量融資的背后,是電商巨頭在具身智能領(lǐng)域的又一次正面交鋒。
過去,阿里、美團(tuán)、京東在電商、外賣、超市、酒旅市場(chǎng)競(jìng)爭(zhēng)得如火如荼,如今戰(zhàn)火延伸到了機(jī)器人。
投資入股成為它們進(jìn)入這一領(lǐng)域的核心方式。
三家大廠的投資行為存在兩個(gè)共性。
其一,它們往往以領(lǐng)投方身份入場(chǎng),不僅是資金的主要提供者,也是對(duì)公司主導(dǎo)全面盡職調(diào)查的一方,深入了解標(biāo)的,下注最重;
其二,大廠的投資布局較為全面,從模型到本體的企業(yè)都有覆蓋。
其中阿里、京東還投了鈦虎機(jī)器人、靈心巧手、帕西尼感知等零部件企業(yè),產(chǎn)業(yè)投資的觸角延伸得更長(zhǎng)。
但三者的差異同樣明顯。
阿里投資的具身智能公司數(shù)量最多,已投了 10 家。
其邏輯并不僅限于業(yè)務(wù)場(chǎng)景,而是更希望通過云計(jì)算和大模型擴(kuò)展人工智能的應(yīng)用邊界,構(gòu)建具身智能技術(shù)生態(tài)。
今年,阿里云與均勝具身智能達(dá)成全面合作,基于通義千問模型打造機(jī)器人智能體,支持工業(yè)、醫(yī)療等場(chǎng)景落地;阿里云「無影」系列云產(chǎn)品則能為具身智能提供彈性算力和跨端協(xié)同。
阿里同時(shí)也在加碼場(chǎng)景化應(yīng)用。去年 12 月,螞蟻集團(tuán)成立具身智能子公司螞蟻靈波科技,面向家庭、養(yǎng)老、醫(yī)療健康等領(lǐng)域打造機(jī)器人產(chǎn)品。
整體來看,阿里的具身智能策略是以「云+大模型」為核心技術(shù)底座,同時(shí)兼顧應(yīng)用端突破。
美團(tuán)雖然在具身智能公司的投資數(shù)量上不及阿里,但將目光從具身智能放大到整個(gè)機(jī)器人領(lǐng)域,會(huì)發(fā)現(xiàn)美團(tuán)對(duì)機(jī)器人布局更早、更廣。
從未來機(jī)器人、非夕、普渡科技等物流、協(xié)作、室內(nèi)配送方向的機(jī)器人本體企業(yè),到智譜 AI、光年之外、月之暗面等大模型和 AI 芯片公司,美團(tuán)幾乎在機(jī)器人相關(guān)的上下游都撒下過棋子。
這種「廣撒網(wǎng)」策略背后,反映出美團(tuán)對(duì)機(jī)器人的認(rèn)知:未來將它們是物理世界的基礎(chǔ)設(shè)施。
就像外賣騎手和即時(shí)配送體系鏈接了線上的數(shù)字世界與線下的物理世界,未來,王興希望延續(xù)這種鏈接,讓機(jī)器人成為數(shù)字指令的物理執(zhí)行者,美團(tuán)則成為這套智能基礎(chǔ)設(shè)施的搭建者與運(yùn)營(yíng)者。
換句話說,美團(tuán)的目標(biāo)不僅是應(yīng)用方,更希望扮演連接線下基礎(chǔ)設(shè)施與線上世界的科技「橋梁」的角色,線下基礎(chǔ)設(shè)施,指的就是機(jī)器人。
京東投資具身智能公司的時(shí)間較晚,今年才開始投資,但節(jié)奏很快,4 個(gè)月內(nèi)就投了 6 家具身公司。
與阿里類似,京東也希望打造具身智能技術(shù)生態(tài),推出了「JoyInside」具身智能平臺(tái),賦能機(jī)器人、機(jī)器狗和 AI 玩具的對(duì)話能力,同時(shí)京東探索研究院也在數(shù)據(jù)、操作、大腦等方面發(fā)布具身智能技術(shù)成果。
不同之處在于,京東更強(qiáng)調(diào)場(chǎng)景導(dǎo)向,重點(diǎn)聚焦零售、物流、家庭三大垂直應(yīng)用。
京東今年已成立側(cè)重家用場(chǎng)景的具身智能相關(guān)部門,并依托電商+物流的雙重身份,將外部技術(shù)與自身需求結(jié)合。
例如,千尋智能公司創(chuàng)始人兼 CEO 韓峰濤就曾表示,京東投資的邏輯在于物流科技需求,千尋的「大腦能力」可助其通過機(jī)器人降低人力依賴、提升訂單準(zhǔn)確性。
綜合來看,三家大廠對(duì)于具身智能乃至機(jī)器人領(lǐng)域的布局特性如下:
美團(tuán):將機(jī)器人視作下個(gè)時(shí)代的基礎(chǔ)設(shè)施,自己不僅是應(yīng)用方,也充當(dāng)鏈接者與運(yùn)營(yíng)者。
阿里:提供云計(jì)算與算力等基礎(chǔ)服務(wù),充當(dāng)具身智能生態(tài)建設(shè)者。
京東:同樣希望成為具身智能生態(tài)建設(shè)者,但目前更多傾向于零售、物流、家庭三大垂類場(chǎng)景的應(yīng)用。
阿里、美團(tuán)、京東分別代表了云生態(tài)、基礎(chǔ)設(shè)施運(yùn)營(yíng)與垂直場(chǎng)景三種截然不同的路線選擇,他們的入場(chǎng),實(shí)質(zhì)上是在以各自最熟悉的方式入局具身智能。
隨著資本、技術(shù)和場(chǎng)景三重力量的匯聚,以自變量為代表的企業(yè),將進(jìn)入「技術(shù)攻堅(jiān) + 生態(tài)競(jìng)合」的新階段。
原文標(biāo)題 : 對(duì)標(biāo)25億美元估值獨(dú)角獸,這家具身智能公司被阿里、美團(tuán)重投

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 人形機(jī)器人,正狂奔在批量交付的曠野
- 4 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 5 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 6 AI版“四萬億刺激”計(jì)劃來了
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線
- 8 2025年8月人工智能投融資觀察
- 9 10 Manus跑路,大廠掉線,只能靠DeepSeek了