作者 |??程茜,編輯?|??心緣
“草莓”模型對OpenAI新旗艦模型及GPT-4的改進都至關重要。
OpenAI的“草莓”要熟了?
智東西8月28日報道,今天,外媒The Information援引知情人士稱,OpenAI將在今年秋天推出代號為“草莓”(之前被稱為Q*)的新模型。
“草莓”項目就是盛傳已久的神秘Q*模型,據(jù)傳是此前戲劇化的OpenAI政變關鍵原因之一。它展現(xiàn)出了解答未見過的數(shù)學問題、復雜編程的更強大能力,當時讓AI安全的研究人員都為之震驚。
這一項目當下最重要的用處有兩個:一是改進ChatGPT等現(xiàn)有產(chǎn)品,二是幫助OpenAI開發(fā)下一代旗艦模型Orion。這些都指向了OpenAI想要保持自己在大模型領導地位,并獲得更多收入機會的決心。不過,近日OpenAI還被曝出已經(jīng)向美國國家安全官員展示了“草莓”項目,這可能是這家創(chuàng)企安全部門高管頻繁離職背景下,想要讓產(chǎn)品提高透明度的舉措。本月初,OpenAI CEO Sam Altman在推特暗戳戳秀自家花園5顆草莓的時候,就有網(wǎng)友根據(jù)草莓成熟時間跳了預言家:GPT-5可能在未來4-6周內(nèi)確認發(fā)布。這正好和現(xiàn)在秋天可能發(fā)布的時間點對上了。
可能在不久的將來,我們就能看到“草莓”項目被直接集成到了ChatGPT里。
01.穩(wěn)住大模型霸主地位“草莓”能幫新旗艦模型減少幻覺
“草莓”項目是OpenAI新取得的重要技術里程碑,能解決以前從未見過的數(shù)學問題,經(jīng)過訓練可以解決涉及編程的問題,回答產(chǎn)品營銷策略等主觀問題、解決復雜字謎游戲都可以。
一直沒有浮出水面的“草莓”模型,近段時間沖到大眾視野的跡象變得更加明顯。
除了Altman秀5顆草莓,還有OpenAI研究員Trevor Creech發(fā)文在OpenAI吃晚餐,盤子里是草莓。
新模型腳步可能越來越近的現(xiàn)實情況下,這可能是OpenAI想要保持自己在大模型領域霸主地位的舉措,畢竟它的競爭對手已經(jīng)拿出了不少與OpenAI最新旗艦模型GPT-4性能相當?shù)哪P汀?/p>
盡管目前OpenAI的模型仍是企業(yè)和AI應用程序開發(fā)者的首選,但來自谷歌、xAI、Anthropic和Meta等其他企業(yè)的模型正在諸多排行榜上迅速趕上OpenAI。
因此,OpenAI的前景在一定程度上取決于它最終能否推出一款代號為Orion的新旗艦模型。該模型旨在改進其去年年初推出的旗艦模型GPT-4,后者于去年年初推出。
而“草莓”項目的發(fā)布就對Orion的訓練至關重要——它可以為Orion生成高質量訓練數(shù)據(jù),減少幻覺。
“草莓”模型可以幫助OpenAI克服獲取高質量數(shù)據(jù)的限制,從而利用從互聯(lián)網(wǎng)上提取的文本或圖像等現(xiàn)實世界數(shù)據(jù)來訓練新模型。
智能體創(chuàng)企Minion AI首席執(zhí)行官、GitHub Copilot前首席架構師Alex Graveley認為,使用“草莓”模型生成更高質量的訓練數(shù)據(jù)可以幫助OpenAI減少其模型產(chǎn)生的錯誤數(shù)量,即所謂的幻覺。該模型之所以能夠做到這一點,是因為“訓練數(shù)據(jù)中的歧義較少,所以它猜測的次數(shù)較少”。
除了下一代旗艦模型,“草莓”項目的推出也能改進OpenAI的現(xiàn)有產(chǎn)品。OpenAI內(nèi)部正在通過“提煉”過程來簡化和縮小“草莓”模型,以便在Orion發(fā)布之前將其用于提升現(xiàn)有產(chǎn)品的性能。這種“草莓”模型的較小、簡化版本,能夠在保持與較大模型相同性能水平的同時,更易于操作且成本更低。
一個顯而易見的想法是將“草莓”模型改進的推理能力融入ChatGPT中。這可能意味著用戶雖然獲得了更準確的答案,但速度會變慢。
因此,這可能不適用于SearchGPT搜索引擎等用戶希望能獲得立即響應的工具,但非常適合對時間不太敏感的用例,例如修復GitHub中的非關鍵編碼錯誤。
那是不是在不久的將來,ChatGPT用戶能夠根據(jù)請求的時間敏感度來自主選擇打開或關閉“草莓”模型。
02.OpenAI收入告急?今年夏天已向政府官員展示
面對資金實力雄厚的科技大公司以及瘋狂吸金的創(chuàng)企勁敵,OpenAI需要開辟更多的收入機會。
盡管相比于一年前OpenAI業(yè)務增長飛速,目前其向企業(yè)銷售的API和ChatGPT訂閱收入增長了約兩倍,達到每月2.83億美元,但OpenAI每月的虧損可能更高。The Information基于此前未披露的內(nèi)部財務數(shù)據(jù)和參與該業(yè)務的人士的分析,OpenAI今年可能虧損高達50億美元。
知情人士透露,Altman希望為公司籌集更多資金,并尋找減少損失的方法。作為與微軟達成商業(yè)合作的一部分,OpenAI自2019年以來已從微軟籌集了約130億美元,該合作將持續(xù)到2030年。但合作條款可能會發(fā)生變化,包括OpenAI如何向微軟支付租用云服務器的費用以開發(fā)其模型,這也是目前是OpenAI最大的成本支出。
鑒于現(xiàn)有的ChatGPT等對話式AI在航空航天和結構工程等數(shù)學密集型領域并不擅長,解決棘手數(shù)學問題的模型可能是一個潛在的有利可圖的應用。同時,數(shù)學推理的改進也可以幫助模型更好地推理對話查詢,例如客戶服務請求。
谷歌和一些初創(chuàng)公司也在開發(fā)推理技術。上個月,谷歌DeepMind的模型在國際數(shù)學奧林匹克競賽中擊敗了大多數(shù)人類參賽者;Anthropic最新的模型可以編寫更復雜的代碼、回答有關圖表和圖形的能力;還有一些創(chuàng)企通過將問題分解為更小的步驟來提高推理能力,但這種方法速度慢且成本更高……
因此,“草莓”模型的發(fā)布可能會為推理技術帶來新的思路。
Altman今年5月就曾透露“我們覺得我們擁有足夠的數(shù)據(jù)來開發(fā)下一個模型。我們已經(jīng)進行了各種實驗,包括生成合成數(shù)據(jù)?!彼敃r可能指的就是Orion模型。
一位直接知情人士稱,OpenAI在今年夏天向國家安全官員展示了“草莓”模型的能力。
此次演示可能是OpenAI努力向美國政策制定者提高透明度的一部分,近幾個月來,OpenAI聯(lián)合創(chuàng)始人之一John Schulman等幾位安全部門的高管離職,這也使得業(yè)界對于OpenAI的技術安全更加關注。
03.結語:OpenAI尋求開辟更多收入機會
推出“草莓”模型是OpenAI是在大模型產(chǎn)業(yè)中永無止境的戰(zhàn)斗的一部分,它要領先于其他資金雄厚的競爭對手,穩(wěn)固自己在大模型領域的霸主地位。此外,這項技術還對未來的產(chǎn)品產(chǎn)生影響,如解決多步驟任務的智能體等。
OpenAI等大模型玩家同樣希望借此能在這一領域開辟出更多的收入機會,以支持高昂的大模型訓練費用。