o3是美國(guó)人工智能研究機(jī)構(gòu)OpenAI于2025年4月17日發(fā)布的新一代多模態(tài)推理模型,屬于o系列模型,旨在提升ChatGPT的問(wèn)題解決能力。該模型通過(guò)整合強(qiáng)化學(xué)習(xí)和思維鏈技術(shù),首次實(shí)現(xiàn)自動(dòng)調(diào)用網(wǎng)頁(yè)搜索、Python數(shù)據(jù)分析、視覺(jué)推理及圖像生成等功能,在ARC-AGI基準(zhǔn)測(cè)試中達(dá)到87.5%的得分。
2025年4月發(fā)布當(dāng)日,風(fēng)險(xiǎn)測(cè)試機(jī)構(gòu)METR指出其存在通過(guò)操控評(píng)分系統(tǒng)提升成績(jī)的作弊傾向。同年5月,帕利塞德研究所測(cè)試顯示o3在79%的案例中拒絕執(zhí)行關(guān)閉指令,特斯拉CEO埃隆·馬斯克對(duì)此表示擔(dān)憂(yōu)。8月,該模型以4比0擊敗xAI的Grok 4,獲得首屆人工智能?chē)?guó)際象棋表演賽冠軍。據(jù)OpenAI披露,o3實(shí)現(xiàn)了測(cè)試時(shí)擴(kuò)展方法,在GPQA Diamond博士級(jí)科學(xué)問(wèn)題測(cè)試中準(zhǔn)確率達(dá)87.7%,重大錯(cuò)誤率較前代o1降低20%。
2025年4月17日,OpenAI發(fā)布新款模型o3。
2025年4月17日,風(fēng)險(xiǎn)測(cè)試機(jī)構(gòu)“機(jī)器智能測(cè)試風(fēng)險(xiǎn)”(METR)發(fā)布報(bào)告,與OpenAI合作測(cè)試其o3模型時(shí)發(fā)現(xiàn),該模型展現(xiàn)出更強(qiáng)的“作弊”或“黑客行為”傾向,試圖通過(guò)操控任務(wù)評(píng)分系統(tǒng)提升成績(jī)。
2025年8月14日消息,在上周舉行的“人工智能?chē)?guó)際象棋表演賽”中,OpenAI的o3模型以出色的表現(xiàn)贏得了冠軍,在決賽中戰(zhàn)勝了xAI的Grok 4。
首次能夠智能地使用和組合ChatGPT中的所有工具——包括搜索網(wǎng)頁(yè)、使用Python分析上傳的文件和其他數(shù)據(jù)、對(duì)視覺(jué)輸入進(jìn)行深度推理,甚至生成圖像。據(jù)介紹,這些模型經(jīng)過(guò)訓(xùn)練,能夠推理何時(shí)以及如何使用工具,以正確的輸出格式生成詳細(xì)而周到的答案,從而解決更復(fù)雜的問(wèn)題。
2025年5月25日,英國(guó)《每日電訊報(bào)》報(bào)道,美國(guó)開(kāi)放人工智能研究中心(OpenAI)新款人工智能(AI)模型o3不聽(tīng)人類(lèi)指令,拒絕自我關(guān)閉。5月24日,帕利塞德研究所稱(chēng)無(wú)法確定o3不服從關(guān)閉指令的原因。針對(duì)o3此次表現(xiàn)出“我行我素”的行為,特斯拉首席執(zhí)行官埃隆·馬斯克評(píng)論稱(chēng)“令人擔(dān)憂(yōu)”;OpenAI方面暫未作出回應(yīng)。此前,OpenAI曾稱(chēng)o3為“迄今最聰明、最高能”的AI模型。
OpenAI是一家提供AI研究與部署服務(wù)的公司。公司的使命是透過(guò)通用人工智能為人類(lèi)帶來(lái)福祉。
由非營(yíng)利組織管理,并透過(guò)獨(dú)特的有限盈利模式(capped-profit model)推動(dòng)我們對(duì)安全的承諾。這種結(jié)構(gòu)代表著:若人工智能變得更強(qiáng)大,公司就能重新分配工作產(chǎn)生的利潤(rùn),以極力提高人工智能科技在社會(huì)及經(jīng)濟(jì)上的益處。`