OpenAI首席技術(shù)官:Sora或?qū)⒃诮衲晗虼蟊娡瞥,增加生成音頻
OpenAI首席技術(shù)官米拉·穆拉蒂(Mira Murati)在接受采訪時透露,Sora文生視頻工具計劃在今年內(nèi)正式推向公眾。此外,OpenAI還計劃為Sora加入音頻生成功能,進一步豐富視頻的場景和情感表達。
目前,Sora模型已經(jīng)具備輸出60秒視頻的能力,其中包含了高度細(xì)致的背景、復(fù)雜的多角度鏡頭以及富有感情的人物、動物角色,自推出以來引起了業(yè)界和消費者的廣泛關(guān)注,但Sora目前只向測試團隊和一部分視覺藝術(shù)家、設(shè)計師和電影制作人開放, 普通人難以體驗Sora文生視頻的魅力。
穆拉蒂透露,目前利用Sora生成視頻的成本過高,這是Sora難以普及的一個重要原因,團隊正在優(yōu)化相關(guān)技術(shù),促進Sora造福更多人。她還表示,OpenAI計劃加入音頻功能,并允許用戶編輯Sora生成的視頻內(nèi)容,以此來使其生成的視頻更符合要求。
Sora的研究表明,通過擴展視頻生成模型是構(gòu)建物理世界通用模擬器的一條極具前景的途徑,對此360創(chuàng)始人周鴻祎曾如此評價:“一旦人工智能接上攝像頭,把所有的電影都看一遍,把YouTube上和TikTok的視頻都看一遍,對世界的理解將遠遠超過文字學(xué)習(xí),一幅圖勝過千言萬語,這就離AGI(通用人工智能)真的就不遠了,不是10年20年的問題,可能一兩年很快就可以實現(xiàn)!
隨著Sora技術(shù)的不斷進步和成本的降低,我們有理由相信,不久的將來,這項創(chuàng)新的視頻生成工具將不再是少數(shù)人的專屬,而是成為大眾創(chuàng)作的新寵。至于Sora的公開是否會促進通用人工智能的發(fā)展,相信我們很快就可以看到答案。
原文標(biāo)題 : OpenAI首席技術(shù)官:Sora或?qū)⒃诮衲晗虼蟊娡瞥觯黾由梢纛l

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預(yù)約>> OFweek 2025具身智能機器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題