加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • Agent平臺AskXBOT
    • “Agent的落地速度比想象中更慢”
    • 翁麗蓮的Agent公式是正確的嗎?
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

OpenAI翁麗蓮的Agent公式,一定是正確的嗎?

01/08 09:30
2927
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

衡宇 發(fā)自 凹非寺,量子位 | 公眾號 QbitAI

2024年了,被寄予厚望的AI Agent,到底是誰在用???!

它被視作通向AGI最有可能的路徑之一,國內(nèi)外公司都研究得火熱,雖然似乎一切只是“押注”,但據(jù)我們所知,有不少toB領(lǐng)域已經(jīng)喜提Agent了。

為什么是toB領(lǐng)域先用上?量子位詢問了一位創(chuàng)業(yè)者,他所創(chuàng)立的AI Agent公司正在為toB領(lǐng)域的許多場景提供服務(wù)。

AI Agent可以被視作管理者跟基礎(chǔ)員工、專家跟基礎(chǔ)員工,員工與員工之間的連接器,能夠填充企業(yè)想做數(shù)字化轉(zhuǎn)型時,所面臨的人和系統(tǒng)之間的空間。

同時他也提到,受目前技術(shù)所限,AI Agent不僅需要和一些傳統(tǒng)技術(shù),比如搜索規(guī)則引擎、知識圖譜等進(jìn)行組合。

更重要的是,Agent必須要知道自己在什么樣的環(huán)境、什么樣的場景下能夠起作用。

恰巧,這位創(chuàng)業(yè)者——瀾碼科技創(chuàng)始人兼CEO周健,剛剛在上海正式發(fā)布了團(tuán)隊(duì)自主研發(fā)的AI Agent平臺AskXBOT。

我們決定以這個平臺為一個案例,來個順藤摸瓜,好好探一探Agent現(xiàn)在的進(jìn)展。

Agent平臺AskXBOT

瀾碼AskXBOT的自我定義,是一個AI Agent平臺。

再詳細(xì)展開一點(diǎn),AskXBOT是基于大語言模型的Agent與工作流設(shè)計(jì)、開發(fā)、使用、管理、知識沉淀的一站式平臺。

從整體結(jié)構(gòu)來看,AskXBOT的設(shè)計(jì)并不繁瑣,它主要由四個部分組成,分別是設(shè)計(jì)器、使用器、管理平臺以及知識中心,為企業(yè)提供文檔檢索、AI調(diào)用、數(shù)據(jù)查詢、智能編程等基礎(chǔ)能力。

設(shè)計(jì)器用于創(chuàng)建和管理AI Agent。在這里,用戶可以通過拖、拉、拽的無代碼方式,設(shè)計(jì)和配置所需的AI Agent的模版,即使是沒有技術(shù)背景,不會寫代碼的用戶,也能輕松創(chuàng)建符合要求的Agent。

使用器則是提供用戶和Agent交互的界面,在這里,用戶可以和Agent對話,讓Agent獲取信息,從而進(jìn)一步執(zhí)行任務(wù)。

顧名思義,管理平臺的主要功能是提供監(jiān)管工具,包括權(quán)限控制、性能監(jiān)控、日志分析等,用這些功能確保Agent的運(yùn)行安全、穩(wěn)定,并在用戶反饋的基礎(chǔ)上持續(xù)優(yōu)化。

而用來沉淀和組織知識資產(chǎn)的知識中心,被瀾碼科技視為核心差異化模塊。專家可以把知識和經(jīng)驗(yàn)輸入知識中心,被Agent學(xué)習(xí)后使用,以提供更準(zhǔn)確的服務(wù)和響應(yīng)。

實(shí)際工作中,專家用戶的數(shù)據(jù)分析流程步驟和分析都非常豐富,理論上而言,專家可以把分析過程數(shù)據(jù)保存下來,做一個SOP(標(biāo)準(zhǔn)作業(yè)程序)。

那么,其他所有的中級或初級的業(yè)務(wù)人員,在不用對專家核心知識死記硬背的時候,就能把相應(yīng)的標(biāo)準(zhǔn)操作分析過程重復(fù)一遍。

“任何一個專家,一天也只能提供24小時的智力和勞動力,不可能無限擴(kuò)張。”周健舉了個非常容易理解的例子,那就是現(xiàn)在用大模型能力,利用Agent,只要加算力,專家的經(jīng)驗(yàn)知識就能夠被復(fù)制。

這么來算的話,如果有30塊顯卡,一個專家的能力就能提供720小時不間斷的服務(wù)。

于是就能理解周健堅(jiān)信的,“如果沒有專家把知識數(shù)字化下來, 那么AI Agent的落地會有很大的困難”。

而為了讓Agent更好地落地,絲滑運(yùn)用到各行各業(yè),瀾碼團(tuán)隊(duì)提出了三步走的AI Agent構(gòu)建法則

第一步,專家知識數(shù)字化;

第二步,基于CUI(對話式用戶交互界面)的柔性交互;

第三步,領(lǐng)域知識的循環(huán)沉淀。

2023年被普遍認(rèn)為是大模型元年,而剛剛開始的2024年,則期望能大幅度拉開Agent發(fā)展的序幕。

周健表示,實(shí)際上瀾碼現(xiàn)在的設(shè)計(jì)思路,就是希望能夠?qū)崿F(xiàn)把Agent本身當(dāng)成是一種生產(chǎn)力。

目前,AskXBOT已經(jīng)有教育、人力資源、銀行、國央企等許多合作客戶。

拿人力獵頭行業(yè)為例,北京人力華明科技公司、CGL等都是瀾碼AskXBOT的使用者。

在與CGL的合作中,瀾碼在其原有的獵頭顧問系統(tǒng)中做了一個Copilot,讓顧問不但能夠高效地篩選、聯(lián)系候選人,還能做一些原本不能完成的事情。

CGL高級副總裁郭雁冰表示,在實(shí)操中,專家作用遠(yuǎn)遠(yuǎn)超過數(shù)據(jù),所以必須在專家知識上下功夫,做出能夠模擬專家行為的Agent。

周健也希望能在下一個版本,讓Agent擁有初步擁有對人才進(jìn)行選、育、用、留的功能。

“Agent的落地速度比想象中更慢”

“讓Agent有選、育、用、留功能,我們離可用技術(shù)實(shí)現(xiàn)這個階段還有多遠(yuǎn)?” “兩年時間吧。”

打破砂鍋問到底,我們終于知道了“2年”這個數(shù)是怎么被估算出來的。

周健的判斷標(biāo)準(zhǔn)首先來自OpenAI。OpenAI在GPT-4問世時曾經(jīng)提過,如果兩年內(nèi)有企業(yè)做AGI能做得比它強(qiáng),它就會投降,并把知道的所有的方法告訴贏家。

憧憬一下,如果OpenAI突然祭出GPT-5,那時候在它基礎(chǔ)上搭建一個AI Agent,是多么爽的一件事(doge)。

言歸正傳,現(xiàn)在離OpenAI的兩年之約已經(jīng)過去了一年,而周健自己判斷2024年不管國內(nèi)還是硅谷,都是AI大模型落地的元年,再往后一年的2025年,因?yàn)橛新涞匕咐?,看到友商或者其他賽道有人已?jīng)落地,并且通過AI競爭大大增收,所以其他廠商肯定會跟進(jìn)。

“這樣的環(huán)境,再疊加GPT-5,所以我認(rèn)為2025年肯定爆發(fā),可能能真的用起來了?!敝芙⌒Φ馈?/p>

聽起來,周健對未來預(yù)期的一切頗有底氣,但是當(dāng)話鋒從未來兩年轉(zhuǎn)回過去一年時,他的態(tài)度是這樣的——

現(xiàn)在年底往前看,大家落地的程度是比我年初想象中的判斷要慢。

2023年3月,差不多是周健剛剛創(chuàng)業(yè)的時間,OpenAI發(fā)布ChatGPT Plugin,愁得他一宿沒睡,滿腦子都是“vocal,我要做的事情GPT做了怎么辦?”

但是時間來到11月份,GPTs亮相的時候,周健自稱這時候心態(tài)是了然于胸的、不慌不忙的。

原因只有一個,就是拜讀3月轟動一時的論文《Sparks of Arti?cial General Intelligence: Early experiments with GPT-4》后,周健當(dāng)時的判斷是GPT-4能夠通用寫50行到100行代碼,“這其實(shí)是很可怕的,因?yàn)橐粋€程序員一天大概也就寫100行代碼,那么GPT-4就能夠代替一個程序員一天的工作量。”

基于這個設(shè)定,當(dāng)時的周健很激進(jìn)地認(rèn)為,各個軟件應(yīng)該能夠立刻馬上原地被AI賦能,2023年年內(nèi)就會開啟淘汰賽,自己和團(tuán)隊(duì)的機(jī)會在比賽剛開始時就被大模型橫掃了。

然而,后期團(tuán)隊(duì)與辦公軟件的合作過程,越做越讓周健發(fā)現(xiàn)了一些不對勁:通用寫50行到100行代碼這個預(yù)估,一下子把我忽悠瘸了。后面再認(rèn)真仔細(xì)看GPT-4的論文,其實(shí)它大概也只能寫2-3行代碼,差距有十倍。

如果能力最強(qiáng)的GPT-4能寫50-100行代碼,那人類可能不剩下啥機(jī)會了。

但如果它只能寫3、5行代碼,你還基于它去做計(jì)劃,那能做的任務(wù)決策的復(fù)雜度是十分受限的。

在正確看到真人程序員和GPT-4的差距,并且對算力有正確的認(rèn)知后,瀾碼提供的私有化部署服務(wù),就逐漸轉(zhuǎn)變?yōu)樾∧P汀⒋竽P蛥f(xié)同,加上作為入口的Root,把任務(wù)拆解出來,用不同的算力、調(diào)用不同的模型來解決這個問題。

翁麗蓮的Agent公式是正確的嗎?

所有關(guān)注Agent的人,幾乎都見過OpenAI華人科學(xué)家翁麗蓮給出的Agent配方:Agent=大模型+記憶+主動規(guī)劃+工具使用

曾幾何時,周健也把這個Agent配方奉為圭臬,但隨著瀾碼在AI Agent領(lǐng)域的實(shí)踐增加,他有了略帶不同的思考。

“現(xiàn)在大家一直在講的具身智能、AI Agent、未來AGI,都是有能力和實(shí)際環(huán)境進(jìn)行交互的?!敝芙∠蛭覀冴U述了他的新觀點(diǎn)新看法,他越來越覺得,Agent最重要的能力是和環(huán)境的互動能力。

當(dāng)然了,工具使用可能還好,主動規(guī)劃和常識記憶仍然是核心點(diǎn),但最具有差異的點(diǎn),可能是在于Agent能否與環(huán)境交互(interaction with environment),在于AI有沒有探索環(huán)境的能力。

周健表達(dá)自己的觀點(diǎn),“如果它對環(huán)境沒有感知,我覺得就不能叫Agent”。反過來說,能意識到環(huán)境是什么樣,有哪些可被調(diào)用的工具,能去發(fā)現(xiàn)、去探索,這個能力很重要。

從這個角度來看,翁麗蓮給出的配方,在周健心中更像是“現(xiàn)階段妥協(xié)于技術(shù)限制的Agent”。

在周健這位AI Agent踐行者眼中,是需要有一個Master Agent進(jìn)行任務(wù)分發(fā)——當(dāng)然,前提一定是對環(huán)境有感知,才能進(jìn)行接下來的探索。

如果要到人機(jī)融身、人機(jī)融合或者說人機(jī)共生的地步,它(Agent)一定是需要自己能夠感知環(huán)境的。
再視這個環(huán)境的大小,可以慢慢提升能力,最后回到Y(jié)ann LeCun提到的世界模型。

當(dāng)然了,比較遺憾的是,上述想法是周健和瀾碼團(tuán)隊(duì)近期才逐步琢磨出來的一個新的探究中心,在AskXBOT中并沒有相應(yīng)的設(shè)置和體現(xiàn)。

不過2024就在面前,在Agent的當(dāng)打之年,Agent本身除了團(tuán)隊(duì)、數(shù)量節(jié)節(jié)攀升以外,或許能力也能涌現(xiàn)一波、突破一波?

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
AT89C51CC03CA-SLSUM 1 Microchip Technology Inc IC MCU 8BIT 64KB FLASH 44PLCC

ECAD模型

下載ECAD模型
$7.71 查看
ATMEGA328PB-AUR 1 Atmel Corporation RISC Microcontroller, CMOS,

ECAD模型

下載ECAD模型
$2.65 查看
ATSAM4S16BA-AU 1 Atmel Corporation RISC Microcontroller, 32-Bit, FLASH, CORTEX-M4 CPU, 120MHz, CMOS, PQFP64, LQFP-64

ECAD模型

下載ECAD模型
$7.22 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜