“反擊”馬斯克,奧特曼說OpenAI有“好得多”的自動(dòng)駕駛技術(shù)
作者 | 邱鍇俊
編輯 | 章漣漪
OpenAI的CEO山姆·奧特曼和特斯拉CEO馬斯克的矛盾,已經(jīng)是硅谷熱門的八卦。
兩人都是OpenAI的聯(lián)合創(chuàng)始人,但是奧特曼將OpenAI轉(zhuǎn)向商業(yè)化運(yùn)營(yíng)之后,馬斯克指責(zé)其背離初心,并起訴他違背創(chuàng)始協(xié)議。另外,馬斯克還成立xAI,和OpenAI直接競(jìng)爭(zhēng)。
奧特曼也奮起反擊,公布郵件顯示,馬斯克試圖掌控OpenAI,遭到拒絕后才不斷阻撓。
奧特曼可能還醞釀了一個(gè)“以其之道還施彼身”的反擊舉措,那就是研發(fā)自動(dòng)駕駛,和特斯拉FSD競(jìng)爭(zhēng)。
最近,奧特曼在做客了自己兄弟杰克·奧特曼的脫口秀,不知是否和兄弟聊天說漏了嘴。
他說:
我想我們有一些新技術(shù),可以為普通汽車提供自動(dòng)駕駛,而且比當(dāng)前技術(shù)要好得多。
I think we have some new technology that could just do self-driving for standard cars way better than any current approach has worked.
這里說比“當(dāng)前技術(shù)”“好得多”,當(dāng)然也包括馬斯克的FSD。
不過,奧特曼并沒有詳細(xì)介紹這一技術(shù)和推進(jìn)的時(shí)間表。只是說:
如果我們的人工智能技術(shù)真能駕馭汽車,那還是很酷的。
If our AI techniques can like really go drive a car that's still pretty cool.
根據(jù)紐約時(shí)報(bào)旗下DealBook的消息,該技術(shù)尚處于早期階段,商業(yè)化也還要很遠(yuǎn)。
據(jù)其分析,這一技術(shù)涉及 OpenAI的Sora視頻軟件及其機(jī)器人團(tuán)隊(duì),但OpenAI 發(fā)言人沒有置評(píng)。
此前,OpenAI并沒有直接探索自動(dòng)駕駛業(yè)務(wù),只是通過投資布局了一些自動(dòng)駕駛、汽車智能化的公司。
當(dāng)然,作為AI應(yīng)用中最被看好的一個(gè)場(chǎng)景,自動(dòng)駕駛擁有廣闊前景,也吸引了巨大關(guān)注。OpenAI如果真有絕招,是絕對(duì)不會(huì)放棄如此巨大的市場(chǎng)的。
如此看來,奧特曼和馬斯克以后大概率會(huì)吵得更兇。
01 什么絕招?
奧特曼上下嘴唇一碰,大家就要相信,OpenAI真有“好得多”的自動(dòng)駕駛技術(shù)嗎?
畢竟當(dāng)前自動(dòng)駕駛也是強(qiáng)手如林,谷歌旗下Waymo、特斯拉、Moblieye、高通、博世、還有一大批來自中國(guó)的企業(yè),都已經(jīng)探索很久了。
OpenAI可能的技術(shù)路徑是什么呢?
大家可能都會(huì)回想起2024年初,OpenAI發(fā)布了Sora——文本生成視頻模型。
Sora生成的視頻
Sora可以根據(jù)用戶輸入的文本,快速制作長(zhǎng)達(dá)一分鐘的高保真視頻,還能獲取現(xiàn)有的靜態(tài)圖像并從中生成視頻。
Sora生成的視頻一下子驚艷了世人,因?yàn)檫@一模型能夠理解復(fù)雜場(chǎng)景中不同元素之間的物理屬性及其關(guān)系,掌握物體在物理世界中的存在和運(yùn)動(dòng)方式,從而生成足以以假亂真的視頻。
幾乎在Sora一發(fā)布,自動(dòng)駕駛、智能駕駛業(yè)界就討論說,可將Sora用于自動(dòng)駕駛的模擬和訓(xùn)練,生成合成視頻數(shù)據(jù),尤其是一些極限場(chǎng)景Corner Case,以彌補(bǔ)現(xiàn)實(shí)數(shù)據(jù)不足或成本高的問題。
然而,也有專業(yè)人士迅速指出,Sora生成的畫面,并不完全符合物理原理,也可能難以捕捉駕駛動(dòng)態(tài),如剎車或轉(zhuǎn)彎的物理行為。因此,并不能用來作為智駕模型訓(xùn)練的視頻數(shù)據(jù)。
不過,后來很多的研究者和從業(yè)者認(rèn)為,符合物理原理的仿真,還是能夠?yàn)閿?shù)據(jù)訓(xùn)練提供數(shù)據(jù)的;蛘撸部梢杂糜趶(qiáng)化訓(xùn)練模型。
近來,自動(dòng)駕駛業(yè)界熱衷于搭建“世界模型”來作為自動(dòng)駕駛模型的基座模型。而OpenAI一開始,就將Sora定義為可以生成視頻的世界模型。
像蔚來、小鵬等開發(fā)的世界模型,邏輯是讓AI系統(tǒng)創(chuàng)建心理上的世界地圖,以理解世界的運(yùn)作方式,就像人類對(duì)世界的理解一樣,然后在此基礎(chǔ)上去駕駛車輛。
Sora的部分理念與世界模型模擬真實(shí)世界的目標(biāo)有一定的契合度。
另外,當(dāng)前自動(dòng)駕駛開發(fā)的主流理念,都是“大數(shù)據(jù)-大模型-大算力”打法。OpenAI沒有駕駛數(shù)據(jù),要想給出更好的自動(dòng)駕駛技術(shù),大算力沒問題,大模型也可以有,大數(shù)據(jù)則是無源之水——如果能靠仿真生成,至少邏輯上說得通。但不少專家認(rèn)為,依賴仿真數(shù)據(jù)存在巨大風(fēng)險(xiǎn)。
02 OpenAI的汽車智能化業(yè)務(wù)
OpenAI自己沒搞過自動(dòng)駕駛,也沒有過做過智能座艙,但是通過其投資,也有所設(shè)計(jì)。
2023 年OpenAI 向Ghost Autonomy投資500萬美元。這家自動(dòng)駕駛公司還同時(shí)獲得了微軟的算力支持,也曾嘗試將AI語言模型應(yīng)用于自動(dòng)駕駛。但是,它在2024年就倒閉了。
Ghost Autonomy的自動(dòng)駕駛車輛
2025年6月10日,OpenAI和汽車智能化公司Applied Intuition達(dá)成合作。雙方合作聚焦于把最新AI技術(shù)發(fā)展成果融入現(xiàn)代汽車,使其轉(zhuǎn)型為智能伙伴。
官方通告說,通過將大語言模型驅(qū)動(dòng)的語音助手和智能體引入車內(nèi),下一代汽車將成為具備深度個(gè)性化體驗(yàn)的生產(chǎn)力工具。
通告還說,合作的核心目標(biāo)之一是實(shí)現(xiàn)移動(dòng)設(shè)備與私人車輛智能系統(tǒng)的無縫連接。此外,Applied Intuition 還將在多個(gè)部門部署 ChatGPT,助力員工提升工作效率、優(yōu)化策略規(guī)劃,以更高效地實(shí)現(xiàn)公司目標(biāo)。
從這些描述來看,合作更偏向于智能座艙的人機(jī)交互方面,而不是直接應(yīng)用于自動(dòng)駕駛。
03 從語言模型到多模態(tài)模型、世界模型
業(yè)界曾有觀點(diǎn)認(rèn)為,依托大語言模型的快速進(jìn)步,自動(dòng)駕駛一類的空間智能可能很快實(shí)現(xiàn)。但是,如今的AI大牛們,都認(rèn)為,光靠語言模型,是不夠的。
OpenAI雖然以大語言模型震驚世人,仍以大型語言模型(LLM)為核心,但已逐步向多模態(tài)模型和世界模型領(lǐng)域延伸。
奧特曼也曾經(jīng)表示,世界模型需具備“理解物理因果關(guān)系、預(yù)測(cè)事件發(fā)展” 的能力,這與 LLM 的推理能力結(jié)合,可能推動(dòng)AGI(通用人工智能)突破。
不僅僅是OpenAI這么判斷。包括人工智能教母李飛飛、Meta首席人工智能(AI)科學(xué)家Yann LeCun(楊立昆)都有類似觀點(diǎn)。
楊立昆就說,當(dāng)前AI雖在多個(gè)領(lǐng)域展現(xiàn)驚人能力,其仍缺乏理解物理世界、持久記憶、邏輯推理與分層規(guī)劃四大人類智能核心特征。
而沒有這些能力的AI,是不可能駕駛汽車的。
解決方案,眾人所指,都是世界模型。
楊立昆在Meta開源世界模型V-JEPA 2是說,在世界模型的幫助下,AI不再需要數(shù)百萬次的訓(xùn)練才能掌握一項(xiàng)新的能力,世界模型直接告訴了AI世界是怎樣運(yùn)行的,這可以極大提升效率。
聽起來,有點(diǎn)奧特曼沒說出來的自動(dòng)駕駛“大招”的影子。
實(shí)踐層面,AI時(shí)代“賣鏟子”的英偉達(dá)已經(jīng)遞上新“鏟子”。
在CES 2025上,英偉達(dá)CEO黃仁勛說,“機(jī)器人的 ChatGPT 時(shí)刻即將到來。與大語言模型類似,世界基礎(chǔ)模型(World Model)對(duì)推動(dòng)機(jī)器人和自動(dòng)駕駛汽車的開發(fā)至關(guān)重要。”
英偉達(dá)發(fā)布的Cosmos 世界基礎(chǔ)模型,就是專為物理交互、工業(yè)環(huán)境和駕駛環(huán)境的高質(zhì)量生成而構(gòu)建,具備生成逼真視頻、創(chuàng)建合成訓(xùn)練數(shù)據(jù)等能力,幫助機(jī)器人和汽車更好地理解物理世界。
英偉達(dá)Cosmos世界模型示意圖
意思是,Cosmos 世界基礎(chǔ)模型比起Sora來,是不是仿真,本來就是“真”。
對(duì)此,OpenAI肯定已經(jīng)著手推進(jìn),將自己的AI版圖擴(kuò)展到空間智能上。
其實(shí),OpenAI很早就有機(jī)器人團(tuán)隊(duì),但2021 年解散了。2024年,機(jī)器人團(tuán)隊(duì)重新組建,并在 2025 年進(jìn)一步擴(kuò)大,并招聘不少硬件機(jī)器人相關(guān)職位。
此外,OpenAI還與機(jī)器人初創(chuàng)公司 Figure 建立了合作關(guān)系,為其人形機(jī)器人提供 AI 模型支持。
人形機(jī)器人的基礎(chǔ)模型和自動(dòng)駕駛非常接近。在探索世界模型的過程中,OpenAI如果有所突破,并將其應(yīng)用于自動(dòng)駕駛,是順理成章的。畢竟,自動(dòng)駕駛市場(chǎng)是毫無疑問的萬億美元級(jí)市場(chǎng)。
奧特曼即便做不成自動(dòng)駕駛,在馬斯克自以為傲的領(lǐng)域阻擊一下他,也算是報(bào)一箭之仇啊。
-END-
原文標(biāo)題 : “反擊”馬斯克,奧特曼說OpenAI有“好得多”的自動(dòng)駕駛技術(shù)

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺語言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 7 張勇等人退出阿里合伙人
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 AI視頻,攪動(dòng)1.5萬億市場(chǎng)
- 10 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市