每日經(jīng)濟(jì)新聞 2024-09-14 22:11:51
每經(jīng)編輯 張錦河 每經(jīng)實(shí)習(xí)編輯 宋欣悅
9月13日,OpenAI宣布了o1系列模型的正式亮相,標(biāo)志著AI領(lǐng)域邁入了一個(gè)全新的紀(jì)元,迎來(lái)了能夠執(zhí)行通用復(fù)雜推理任務(wù)的大模型時(shí)代。模型發(fā)布后,OpenAI研究團(tuán)隊(duì)在X社交平臺(tái)上舉辦了一場(chǎng)AMA(Ask Me Anything)活動(dòng),深度揭秘了o1系列模型的諸多細(xì)節(jié)。
OpenAI表示,o1系列包括兩個(gè)版本:作為完整模型早期迭代的o1-preview,以及速度更快的輕量級(jí)o1-mini。與之前的模型不同,o1能夠在給出最終答案前生成長(zhǎng)鏈的隱藏思維過(guò)程,展現(xiàn)了類似人類的推理能力。研究人員將o1比喻為擁有超能力的“外星人”。
在推理過(guò)程中,o1使用了強(qiáng)化學(xué)習(xí)來(lái)實(shí)現(xiàn)“推理”這一性能。盡管目前沒(méi)有計(jì)劃向API用戶或ChatGPT展示這些思維鏈token,但研究人員透露,嵌入提示中的指令可以影響o1的思維方式。相比之下,GPT-4o無(wú)法通過(guò)提示達(dá)到o1的思維鏈性能水平。
o1系列模型使用與GPT-4o相同的分詞器,在輸入token上保持一致。不過(guò),o1能夠處理更長(zhǎng)、更開(kāi)放的任務(wù),減少了對(duì)輸入分塊的需求。未來(lái),o1還將支持更大的輸入上下文窗口。
o1還展現(xiàn)了令人印象深刻的推理和泛化能力,例如破譯密碼、思考哲學(xué)問(wèn)題以及通過(guò)自我測(cè)驗(yàn)來(lái)評(píng)估自身能力。
研究團(tuán)隊(duì)還透露,o1-preview在某些個(gè)性化寫(xiě)作任務(wù)上的表現(xiàn)與GPT-4o相當(dāng)或略勝一籌。
與o1-preview相比,o1-mini在體積和速度上進(jìn)行了優(yōu)化。
盡管在像世界知識(shí)這樣的某些領(lǐng)域可能有局限,但o1-mini在STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))任務(wù)以及代碼相關(guān)任務(wù)上展現(xiàn)出了其優(yōu)勢(shì)。此外,o1-mini能夠探索比o1-preview更多的思維鏈。
盡管o1-preview目前尚未使用工具,但OpenAI計(jì)劃為其加入功能調(diào)用、代碼解釋器和網(wǎng)頁(yè)瀏覽等能力。工具支持、結(jié)構(gòu)化輸出和系統(tǒng)提示也將在未來(lái)的更新中推出。
此外,OpenAI開(kāi)發(fā)者團(tuán)隊(duì)表示,未來(lái)用戶將有望能夠控制o1的思考時(shí)間以及token限制,并承諾將積極推進(jìn)這一功能的實(shí)現(xiàn)。
OpenAI還在積極推進(jìn)流式傳輸支持和API中的推理進(jìn)度反饋。此外,o1已經(jīng)內(nèi)置了多模態(tài)能力,有望在多模態(tài)理解任務(wù)(MMLU)上達(dá)到最先進(jìn)的水平。
o1-mini目前對(duì)ChatGPT Plus用戶開(kāi)放,但有每周50次的提示限制,所有提示都計(jì)入相同的配額。OpenAI承諾,未來(lái)將逐步提高API訪問(wèn)級(jí)別和速率限制,并在限制放寬后提供批量定價(jià)優(yōu)惠。
o1模型的定價(jià)預(yù)計(jì)將遵循每1-2年降價(jià)的趨勢(shì)。此外,個(gè)性化微調(diào)支持已在產(chǎn)品路線圖中,但具體發(fā)布時(shí)間表尚不明確。
o1-mini目前使用截至2023年10月的數(shù)據(jù)進(jìn)行訓(xùn)練,未來(lái)的迭代將使用更新的數(shù)據(jù)集來(lái)擴(kuò)充其世界知識(shí)。
為了充分發(fā)揮o1的推理優(yōu)勢(shì),團(tuán)隊(duì)建議用戶在設(shè)計(jì)提示時(shí)提供信息豐富、涵蓋邊緣案例的具體示例,并明確指定所需的推理步驟和風(fēng)格。但要注意,無(wú)關(guān)的上下文可能會(huì)干擾模型的推理過(guò)程。
每日經(jīng)濟(jì)新聞綜合自公開(kāi)消息
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP