OpenAI發(fā)布最強AI模型!
沒等來GPT-5,卻等來了OpenAI悄悄發(fā)布的「o3-pro」。
我們一起看看這個聲稱 “最強AI模型” 的o3-pro,有哪些亮點?適合哪些人使用?
1 什么是o3-pro?
簡單來說,o3-pro是o3推理模型的加強版。官方介紹它是目前推理能力最強的一代。
具體來說,o3-pro是專門為復(fù)雜問題設(shè)計的:它不追求快,而是強調(diào)“想得清楚”。像數(shù)學、科學、編程、寫作、教育類任務(wù),它處理得更有條理,輸出內(nèi)容更準確、結(jié)構(gòu)更清晰。
2 性能表現(xiàn)亮眼
先來上成績單。
在專家評估中,o3-pro比o3得到了更多認可。
在OpenAI內(nèi)部的測試數(shù)據(jù)中,o3-pro表現(xiàn)相當亮眼:
在數(shù)學測試AIME 2024中,超過了谷歌的 Gemini 2.5 Pro。
在GPQA Diamond(博士級科學知識評測)中,勝過了Anthropic家的 Claude 4 Opus。
在編程測試Codeforces中,也比前代模型有了不小的提升。
這些測試都是針對邏輯嚴謹性和知識深度的高難度評估。能在這里脫穎而出,確實說明了OpenAI在思考推理能力上的進步。
此外,OpenAI還用 “4/4可靠性評估” 來證明了o3-pro的可靠性(4次回答全部正確才被視為成功)。
3 價格如何?
來看下API調(diào)用的價格:
輸入:$20/百萬token
輸出:$80/百萬token
相較于普通o3,價格貴了10倍......
4 最強也有局限性
再強的模型,也不是十全十美。
OpenAI列出了目前o3-pro存在的一些局限:
速度比前代慢,輸出時間更長;
暫不支持圖像生成;
暫時不兼容Canvas功能;
ChatGPT中無法使用“臨時對話”功能。
不過這些問題對大多數(shù)文字為主的使用場景來說,影響不大。但如果你要的是深度和準確性,那就得接受慢工出細活兒。
目前,o3-pro已經(jīng)面向ChatGPT Pro和Team用戶開放,企業(yè)和教育用戶下周可用。
如果你日常對AI回答的質(zhì)量、準確率有較高要求,不妨試試看。
原文標題 : OpenAI發(fā)布最強AI模型!

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字