分享
國(guó)家互聯(lián)網(wǎng)信息辦公室準(zhǔn)許從事互聯(lián)網(wǎng)新聞信息服務(wù)業(yè)務(wù)的網(wǎng)站
互聯(lián)網(wǎng)新聞信息服務(wù)許可證編號(hào):10120220005
中新經(jīng)緯>>科技>>正文

Agent熱度飆升,一場(chǎng)暫被高估的“效率游戲”

2025-03-26 20:20:26 第一財(cái)經(jīng)

  Agent熱度飆升,一場(chǎng)暫被高估的“效率游戲”

  作者:呂倩 鄭栩彤

  從天使輪押注DeepWisdom到目前新輪融資,遠(yuǎn)望資本創(chuàng)始合伙人程浩的投資回報(bào)頗豐。AI+創(chuàng)始人和投資人段雨嫣對(duì)記者表示,近期Agent概念因基座模型技術(shù)的成熟而熱度提升,美國(guó)硅谷幾乎每一家公司都在做Agent。

  創(chuàng)業(yè)者群體中,Convergence AI 工程負(fù)責(zé)人鄭淺對(duì)記者表示,海外市場(chǎng)垂類(lèi)Agent早有案例,相對(duì)來(lái)說(shuō),通用類(lèi)Agent在OpenAI相關(guān)產(chǎn)品發(fā)布后熱點(diǎn)得到提升。在Pokee AI創(chuàng)始人、前Meta應(yīng)用強(qiáng)化學(xué)習(xí)負(fù)責(zé)人朱哲清的體感上,去年下半年,他所接觸的VC還沒(méi)有一家十分清晰地理解公司為什么做、怎么做Agent,而今年春節(jié)前后,包括投資人與潛在客戶(hù),大批行業(yè)人士前來(lái)向他咨詢(xún)Agent相關(guān)的問(wèn)題。

  整個(gè)人工智能領(lǐng)域熱度的逐漸高漲,背后是不同時(shí)間點(diǎn)不同“爆款”AI產(chǎn)品的助推。包括DeepSeek在春節(jié)期間完成對(duì)大眾關(guān)于大語(yǔ)言模型的教育與普及,1月OpenAI Operator清晰演示了AI Agent的樣板;3月Manus的出圈啟動(dòng)了對(duì)Agent市場(chǎng)的教育。

  市場(chǎng)研究機(jī)構(gòu)Gartner 將 Agentic AI 列為 2025 年十大技術(shù)趨勢(shì)之一,并指出到 2028 年至少 15% 的日常工作決策將通過(guò) Agentic AI 自主完成。記者調(diào)研觀察,目前海外市場(chǎng)中,Agent基于資本對(duì)技術(shù)長(zhǎng)期投資、相對(duì)充裕的算力支撐、付費(fèi)習(xí)慣較成熟、資本對(duì)技術(shù)創(chuàng)新與商業(yè)化進(jìn)展的包容等原因,已有不少案例。但在國(guó)內(nèi)市場(chǎng)中,Agent暫處于大廠戰(zhàn)略布局范疇內(nèi),尚未大范圍涌入普通用戶(hù)的生活中。

  Agent革新與亂象并存

  Agent可以翻譯為代理、智能體、助理等,概念最早萌芽于1959年,用于解釋更大系統(tǒng)的自主行為。2010年之后,基于大模型驅(qū)動(dòng),Agent逐漸具備跨任務(wù)知識(shí)遷移和快速學(xué)習(xí)能力,如微軟推出 Microsoft 365 Copilot,通過(guò) Agent 自動(dòng)化辦公流程;OpenAI旗下ChatGPT 插件生態(tài)賦能第三方工具集成;谷歌Project Astra 打造個(gè)人智能助手,整合搜索與多模態(tài)能力。

  至于大語(yǔ)言模型(LLM)與Agent之間的關(guān)系,前者接收文字、圖片等內(nèi)容,輸出相應(yīng)文字或圖片,但沒(méi)有記憶,無(wú)法連接真實(shí)環(huán)境或操作外部工具。Agent以L(fǎng)LM為“大腦”,加上記憶與軀體,可以感知環(huán)境、記憶過(guò)程、執(zhí)行任務(wù)、規(guī)劃與行動(dòng)。

  近期海內(nèi)外熱點(diǎn)事件推動(dòng),伴隨模型技術(shù)提升,Agent熱度漸起。鄭淺對(duì)記者表示,2025年1月,OpenAI發(fā)布Operator之后,Agent行業(yè)啟動(dòng)了新一輪的熱潮,Convergence AI初期也獲得1200萬(wàn)美元Pre-seed投資。此前國(guó)外市場(chǎng)中,垂類(lèi)Agent較為豐富,如聚焦醫(yī)療、金融、法律等具體場(chǎng)景;诜奖懵涞、痛點(diǎn)解決精準(zhǔn)而獲得客戶(hù)買(mǎi)單。而Operator“打樣”之后,通用型Agent行業(yè)開(kāi)啟了新輪熱潮,創(chuàng)業(yè)者開(kāi)啟項(xiàng)目推進(jìn),VC前來(lái)咨詢(xún)項(xiàng)目技術(shù)更新。

  另一種分類(lèi)方式在鄭淺看來(lái),也可以分為已經(jīng)落地的通用型Agent、備受關(guān)注的開(kāi)發(fā)中產(chǎn)品,以及為Agent AI提供服務(wù)的產(chǎn)品。通用型如OpenAI的Operator,系行業(yè)第一個(gè)真正落地的通用協(xié)議型Agent,目前僅限美國(guó)地區(qū)使用;Convergence AI Proxy在Operator亮相兩天后向公眾開(kāi)放,專(zhuān)注于研發(fā)Agent;Anthropic的computer use是一個(gè)企業(yè)級(jí)API服務(wù),嚴(yán)格來(lái)說(shuō)不算產(chǎn)品。但它的推出為這方向的AI產(chǎn)品奠定了技術(shù)基礎(chǔ),影響深遠(yuǎn)。

  開(kāi)發(fā)中的產(chǎn)品如谷歌的Project Magi,最初Demo在去年12月,核心方向偏向人機(jī)交互,目標(biāo)將AI Agent整合到Chrome瀏覽器中,但目前官方未透露更多細(xì)節(jié)。服務(wù)型產(chǎn)品如BrowserBase和Browser Use,是為瀏覽器Agent提供虛擬瀏覽器服務(wù)的公司;Microsoft Azure正在緊鑼密鼓研究為AI Agent提供虛擬機(jī)服務(wù)。

  另外,目前Agent也可粗淺分為垂直型與通用型。Monica雖然官方宣稱(chēng)推出通用型AI Agent Manus,官方演示案例中涉及了簡(jiǎn)歷篩選、股票分析、購(gòu)房推薦、課程設(shè)計(jì)、文娛創(chuàng)作等多個(gè)種類(lèi),輸出形式包括文檔、圖像、音頻、Dashboard等不同類(lèi)型的輸出。但由于垂直功能不夠精準(zhǔn),反而側(cè)面證明通用型Agent目前難以完成垂直功能的“專(zhuān)精深”。

  需注意的是,Agent熱度的暴漲也使得目前行業(yè)存在“Agent Washing”(智能體清洗)的亂象。AW是指AI領(lǐng)域中,部分企業(yè)通過(guò)重新包裝現(xiàn)有技術(shù)或簡(jiǎn)單自動(dòng)化工具,宣稱(chēng)其具備 AI Agent功能,但實(shí)際并未驗(yàn)證或?qū)崿F(xiàn)真正的自主決策、學(xué)習(xí)和適應(yīng)能力的現(xiàn)象,利用市場(chǎng)對(duì) AI Agent 的熱度進(jìn)行營(yíng)銷(xiāo),導(dǎo)致市場(chǎng)混淆和誤導(dǎo)性投資。

  具體如將傳統(tǒng)的聊天機(jī)器人、RPA(機(jī)器人流程自動(dòng)化)工具或基于規(guī)則的系統(tǒng)重新命名為 “AI Agent”,但核心功能仍依賴(lài)預(yù)設(shè)指令或簡(jiǎn)單邏輯,缺乏自主性;蛘咝Q(chēng)產(chǎn)品具備 “自主決策”“持續(xù)學(xué)習(xí)” 等能力,但實(shí)際無(wú)法處理復(fù)雜環(huán)境或未預(yù)見(jiàn)情況,如將簡(jiǎn)單的郵件自動(dòng)回復(fù)工具稱(chēng)為 “銷(xiāo)售智能體”,將固定流程的客服腳本包裝為 “智能服務(wù)代理”。還有一種是模糊 “AI 助手”“工具” 與 “AI Agent” 的邊界,如將僅提供信息檢索的工具宣傳為具備獨(dú)立行動(dòng)能力的智能體。

  AI Agent行業(yè)早期,泛濫的“Agent Washing”亂象可能導(dǎo)致企業(yè)因誤判技術(shù)價(jià)值投入資金,卻未能獲得預(yù)期的自動(dòng)化或效率提升,導(dǎo)致資源浪費(fèi);用戶(hù)對(duì)AI Agent的實(shí)際能力產(chǎn)生懷疑,阻礙真正創(chuàng)新技術(shù)的落地;以及虛假宣傳掩蓋實(shí)時(shí)性差、可解釋性弱等真實(shí)技術(shù)瓶頸,導(dǎo)致市場(chǎng)過(guò)熱與后續(xù)回調(diào)風(fēng)險(xiǎn)。在具體判斷與界定上,用戶(hù)可以通過(guò)相關(guān)產(chǎn)品能否在無(wú)人工干預(yù)下完成任務(wù)、是否支持動(dòng)態(tài)優(yōu)化策略、能否應(yīng)對(duì)未預(yù)設(shè)的場(chǎng)景、能否清晰展示決策過(guò)程、是否支持與其他系統(tǒng)或人類(lèi)協(xié)同工作等方面進(jìn)行區(qū)分。

  垂類(lèi)與通用Agent將并存

  那么,Agent具體是何如運(yùn)作的?

  在工作模式上,吳恩達(dá)此前提及,在應(yīng)用中構(gòu)建具有Agentic推理或Agentic工作流的方法有四種主要設(shè)計(jì)模式:反思型設(shè)計(jì)模式、tool use(API calls功能調(diào)用)、規(guī)劃或推理、多智能體協(xié)作(Multi-agent Collaboration多智能體協(xié)作)等。

  在這樣的工作方式分類(lèi)邏輯下,Manus以明顯的tool use形式破圈傳播。但在用戶(hù)使用端,多位行業(yè)人士對(duì)記者表達(dá)了“早期階段”的判斷。一位AI領(lǐng)域從業(yè)者對(duì)記者表示,Manus在長(zhǎng)期任務(wù)中表現(xiàn)較差,多個(gè)步驟的任務(wù)會(huì)因?yàn)槊恳徊降募?xì)微誤差被放大,導(dǎo)致最終失敗。核心問(wèn)題是工具能力較差,雖做了規(guī)劃和計(jì)劃,但實(shí)際執(zhí)行出來(lái)的效果不及預(yù)期,所以導(dǎo)致整個(gè)任務(wù)失敗。這方面的原因不在規(guī)劃能力,而是規(guī)劃了卻沒(méi)有足夠的tools去執(zhí)行,或者tools太簡(jiǎn)單,導(dǎo)致復(fù)雜問(wèn)題無(wú)法處理,而tools豐富生態(tài)的搭建需要足夠資金實(shí)力支撐才能破解。

  另外,行業(yè)人士對(duì)記者表示,Manus目前屬于“堆tools”的形式,而這種形式無(wú)法進(jìn)行持續(xù)進(jìn)化。朱哲清也認(rèn)為,做Agent需要考慮的幾個(gè)板塊包括通用性、算力部署要求、工具調(diào)用能力、執(zhí)行力。其中,工具調(diào)用是比較復(fù)雜的問(wèn)題。

  AI工程師、Pleias聯(lián)合創(chuàng)始人 亞歷山大·多里亞(Alexander Doria )此前發(fā)文表示,未來(lái) AI 智能體的發(fā)展方向會(huì)是模型本身,而不是工作流(Work Flow)。而Manus 基于預(yù)先編排好的提示詞與工具路徑構(gòu)成的工作流智能體,短期或許表現(xiàn)不錯(cuò),但長(zhǎng)期必然遇到瓶頸,核心原因就是提示驅(qū)動(dòng)的方式無(wú)法擴(kuò)展,也無(wú)法真正處理那些需要長(zhǎng)期規(guī)劃、多步驟推理的復(fù)雜任務(wù)。

  中金公司研究部認(rèn)為,相比于上述海外廠商在Agent底層技術(shù)上的創(chuàng)新,Manus更多是一種模式上的創(chuàng)新:Manus證明了多代理模式可以相對(duì)容易地實(shí)現(xiàn)通用AI Agent的落地,這也與海外廠商推出構(gòu)建模塊、統(tǒng)一API協(xié)議的目的比較類(lèi)似;“展示過(guò)程”的形式有助于降低大眾的理解門(mén)檻,提高用戶(hù)對(duì)AI產(chǎn)物的信任度,并催化AI Agent實(shí)現(xiàn)大規(guī)模落地。

  中金公司引用LangChain(專(zhuān)注于AI應(yīng)用開(kāi)發(fā)的開(kāi)源框架提供商)調(diào)查報(bào)告顯示:人們?cè)陂L(zhǎng)耗時(shí)任務(wù)中對(duì)AI Agent有較大需求,但同時(shí),用戶(hù)對(duì)AI Agent普遍存在“完成質(zhì)量”或“可靠性”方面的擔(dān)憂(yōu),AI Agent在復(fù)雜場(chǎng)景中并不一定能夠持續(xù)保持響應(yīng)和問(wèn)題解決路徑的準(zhǔn)確性,因此有一半以上的受訪(fǎng)者在實(shí)際使用中會(huì)為AI Agent補(bǔ)充跟蹤和觀察的控件。

  拋開(kāi)通用Agent早期尚存的不足,鄭淺更看好通用型Agent的前景。一方面,OpenAI的Operator已經(jīng)為行業(yè)“打了樣”,另一方面,通用型可以通過(guò)簡(jiǎn)單化任務(wù)、小體量模型完成,在海外算力較為充足的背景下,通用型Agent比拼的主要是小模型與工程能力。模型不是越大越好,而是適合才好,工程也是Agent領(lǐng)域重要影響因素。

  更重要的是,鄭淺認(rèn)為,通用型Agent可以同時(shí)自主完成不同任務(wù),具備規(guī)劃和重新規(guī)劃能力,而實(shí)現(xiàn)這一功能的核心就是Agent另一個(gè)“大腦”——Agent Orchestrator。上文所提LLM是Agent進(jìn)行思考和決策的核心組件,在多Agent系統(tǒng)中,LLM負(fù)責(zé)單個(gè)Agent內(nèi)部語(yǔ)言處理和決策,Agent orchestrator負(fù)責(zé)決定哪個(gè) Agent來(lái)處理特定的任務(wù),以及如何在多個(gè) Agent 之間傳遞信息,讓Agent各司其職,最大化效率。

  基于這樣的邏輯,鄭淺判斷通用型Agent中,并行Agent將是未來(lái)趨勢(shì)。但整個(gè)行業(yè)內(nèi),垂類(lèi)Agent將與通用Agent長(zhǎng)期并存甚至達(dá)成“合作”,例如垂類(lèi)工具接入通用Agent平臺(tái),補(bǔ)足后者在具體行業(yè)方面的欠缺。

  大廠蓄勢(shì),行業(yè)尚早

  任何一個(gè)新興領(lǐng)域,創(chuàng)業(yè)者都免不了面臨“大廠來(lái)了”怎么辦的問(wèn)題。程浩稱(chēng):PC互聯(lián)網(wǎng)時(shí)代,VC對(duì)創(chuàng)業(yè)者最常見(jiàn)的問(wèn)題是“你這個(gè)項(xiàng)目如果騰訊做了怎么辦?”進(jìn)入AI時(shí)代,VC仍然會(huì)問(wèn)此類(lèi)問(wèn)題,只是騰訊變成了字節(jié)。

  據(jù)記者了解,字節(jié)跳動(dòng)Dev Infra團(tuán)隊(duì)已開(kāi)發(fā)出一款功能類(lèi)似Manus的智能體產(chǎn)品,名為Dev Agent,主要通過(guò)集成內(nèi)網(wǎng)知識(shí)庫(kù)與多種內(nèi)部工具實(shí)現(xiàn)調(diào)研、開(kāi)發(fā)、數(shù)據(jù)分析等任務(wù)。記者獲悉,Dev Agent是一款實(shí)驗(yàn)性質(zhì)的內(nèi)部工具,僅面向開(kāi)發(fā)部門(mén)內(nèi)測(cè)使用。

  在技術(shù)方面,字節(jié)此前提出基于強(qiáng)化學(xué)習(xí)(RL)的 LLM Agent 框架 AGILE,會(huì)主動(dòng)向人類(lèi)專(zhuān)家咨詢(xún),增強(qiáng)了快速適應(yīng)新任務(wù)的泛化能力。產(chǎn)品方面,“Coze 扣子” 作為 AI bot 開(kāi)發(fā)平臺(tái),堪稱(chēng)字節(jié)版GPTs,提供豐富的Agent工具。目前豆包電腦版APP已呈現(xiàn)瀏覽器模式,將已有AI工具匯總調(diào)用,輸入“撰寫(xiě)一段貪吃蛇的代碼并運(yùn)行”,豆包可調(diào)用工具、演示過(guò)程、最終運(yùn)行。

  阿里主推的AI時(shí)代代表應(yīng)用夸克近期推出“超級(jí)框”概念,阿里巴巴智能信息事業(yè)群總裁的吳嘉表示,“超級(jí)框”不是ChatBot或搜索,而是直接交付結(jié)果的“超級(jí)Agent”——用戶(hù)在“框”中表達(dá)意圖,AI會(huì)調(diào)用工具與方法來(lái)幫你寫(xiě)一份工作報(bào)告、旅游計(jì)劃,或是一份就醫(yī)指南。

  目前在整個(gè)阿里集團(tuán)戰(zhàn)略布局中,夸克被寄望于搭建AI時(shí)代“超級(jí)入口”,但同時(shí),作為試水探路者,目前夸克方面暫未嘗試重投入,因此在Agent模式上,暫時(shí)處于阿里自有工具調(diào)用的早期形式,未接入增加更多算力耗費(fèi)與技術(shù)復(fù)雜性的中間調(diào)優(yōu)與反饋。

  除上述大廠案例,記者觀察到的主流Agent代表案例暫時(shí)集中于海外市場(chǎng)。談及海外大廠的競(jìng)爭(zhēng),鄭淺對(duì)記者表示,各行業(yè)有各自專(zhuān)攻領(lǐng)域。OpenAI、Anthropic及Deepmind在模型研發(fā)方面確實(shí)強(qiáng)大,但他們?cè)诋a(chǎn)品開(kāi)發(fā)方面表現(xiàn)不佳。如過(guò)去兩年OpenAI推出了GPTs或Prompt Store等多款產(chǎn)品,但大多是失敗的。

  另外,Agent公司的創(chuàng)業(yè)核心競(jìng)爭(zhēng)力在于其Agentorchestrator。目前雖有開(kāi)源模型,但沒(méi)有人開(kāi)源真正的Agentorchestrator,各家公司都有獨(dú)特做法。如何構(gòu)建有效的AgentOrchestrator的能力在未來(lái)一兩年內(nèi)都將是Agent創(chuàng)業(yè)公司重要的核心競(jìng)爭(zhēng)力。

  目前在Agent生態(tài)構(gòu)建呈現(xiàn)大廠定制規(guī)則、創(chuàng)業(yè)公司沖刺創(chuàng)新的局面,大廠相繼推出構(gòu)建模塊、構(gòu)建平臺(tái)等Agent開(kāi)發(fā)工具,打造專(zhuān)有生態(tài)。

  2025年3月11日OpenAI發(fā)布了其第一組構(gòu)建模塊,通過(guò)Response API,用戶(hù)通過(guò)幾行代碼調(diào)用OpenAI的內(nèi)置工具來(lái)構(gòu)建符合自身需求的Agent,而無(wú)需再專(zhuān)門(mén)編寫(xiě)調(diào)用外部工具的復(fù)雜代碼,大大簡(jiǎn)化了Agent開(kāi)發(fā)的流程。區(qū)別于建立一站式構(gòu)建平臺(tái),Anthropic推出MCP開(kāi)放標(biāo)準(zhǔn),同樣致力于提升Agent開(kāi)發(fā)能力和效率。

  但目前行業(yè)對(duì)MCP持有不同觀點(diǎn),鄭淺對(duì)記者表示,MCP 更像是一個(gè) API,雖然使用起來(lái)方便,但其可擴(kuò)展性和適用性都有一定局限。如果要構(gòu)建真正的通用型 Agent,僅依靠 MCP 的接口會(huì)受到限制,因?yàn)橹С值能浖邢蕖?/p>

  朱哲清告訴記者,長(zhǎng)期來(lái)看,協(xié)議統(tǒng)一對(duì)于某個(gè)Agent體系的構(gòu)建非常重要,但目前來(lái)看,協(xié)議在短期內(nèi)不會(huì)有共識(shí),原因在于還沒(méi)有哪家Agent公司已經(jīng)做到最好。要等出現(xiàn)一家公司將Agent商業(yè)化應(yīng)用做到很好的情況下,才會(huì)吸引很多人用它的工具,才有可能統(tǒng)一市場(chǎng)。而目前,即便是較早面世的MCP,所帶來(lái)的價(jià)值也有限,MCP可以幫助工具標(biāo)準(zhǔn)化,但大多數(shù)情況下工具都不是標(biāo)準(zhǔn)化的。Claude集成的MCP Agent也更多處于開(kāi)發(fā)者測(cè)試和體驗(yàn)的狀態(tài),還沒(méi)有到商用的程度。

來(lái)源:第一財(cái)經(jīng)

編輯:張嘉怡

廣告等商務(wù)合作,請(qǐng)點(diǎn)擊這里

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人

中新經(jīng)緯版權(quán)所有,未經(jīng)書(shū)面授權(quán),任何單位及個(gè)人不得轉(zhuǎn)載、摘編或以其它方式使用。
關(guān)注中新經(jīng)緯微信公眾號(hào)(微信搜索“中新經(jīng)緯”或“jwview”),看更多精彩財(cái)經(jīng)資訊。
關(guān)于我們  |   About us  |   聯(lián)系我們  |   廣告服務(wù)  |   法律聲明  |   招聘信息  |   網(wǎng)站地圖

本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書(shū)面授權(quán)。

未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。

[京B2-20230170]  [京ICP備17012796號(hào)-1]

違法和不良信息舉報(bào)電話(huà):18513525309 報(bào)料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn

Copyright ©2017-2025 jwview.com. All Rights Reserved


北京中新經(jīng)聞信息科技有限公司