【摘要】AI Agent元年,繁荣与泡沫交织。本文深度剖析其结构性困局与商业化难题,探讨通用与垂直路线之争,揭示穿越“窄门”通向“宽路”的突围之道。

引言

2025年,科技界的聚光灯几乎全部投向了一个炙手可热的名词:AI Agent。随着GPT-5等新一代大模型在复杂推理、多模态融合及自主代理能力上实现惊人飞跃,一声嘹亮的号角仿佛宣告着一个新纪元的到来——“AI Agent时代真的来了”。资本闻风而动,创业者蜂拥而至,全球市场规模迅速膨胀至千亿美元级别,超过85%的年增长率让这条赛道显得无比辉煌。

然而,繁荣的B面,是刺骨的寒意。著名投资人朱啸虎将当下的AI智能体创业比作“互联网早期的个人站长”,一语道破了其中的草根精神与残酷真相。喧嚣之中,曾被捧为“国运级产品”、内测邀请码一度炒至十万元天价的明星Agent——Manus,在其估值飙升至5亿美元的高光时刻,却悄然按下了退出中国市场的按钮。这一戏剧性的转折,如同一块巨石投入湖心,激起的涟漪远未平息。

Manus的窘境并非孤例,它更像是当前Agent赛道集体困境的一面棱镜,折射出技术、商业与产品市场契合度(PMF)的多重挑战。在“元年”的光环之下,无数产品如雨后春笋般涌现,从扣子空间(Coze Space)到GenSpark,从心响到心流,星光熠熠。但光鲜背后,是高昂的开发成本、惨淡的用户付费意愿、严重的功能同质化,以及居高不下的用户流失率。

那么,这场席卷全球的AI Agent浪潮,究竟是引领下一代技术革命的真实序曲,还是一场被资本与期望吹捧起来的虚假繁荣?本文将深入剖析AI Agent在元年所面临的虚火、结构性困局与商业化难题,探讨通用与垂直两条路线的激烈分野,并试图寻找出一条穿越重重迷雾,从“窄门”迈向“宽路”的突围之道。

一、📈 繁荣下的虚火:当元年光环遭遇现实骨感

“元年”一词,往往意味着混沌初开、万物生长,充满了无限的可能性与未经证实的狂热。2025年的AI Agent赛道,完美诠释了这一特征。市场的喧嚣与资本的追捧共同构建了一幅烈火烹油的盛景,但细究其商业逻辑的根基,却发现地基之下并非全是磐石。

1.1 “元年”的喧嚣与资本狂热

AI Agent的火爆,首先源于其颠覆性的叙事。它不再是简单的“工具”,而是被赋予了“自主决策”与“执行任务”能力的“智能体”。这种从被动响应到主动执行的范式转移,让人们看到了重塑软件交互、乃至整个数字世界的潜力。

  • 宏大叙事驱动市场:“打造AI时代的操作系统”、“每个人的全能AI助理”,这些极具想象力的口号,精准地击中了投资人和早期用户的兴奋点,迅速催生了FOMO(错失恐惧)效应。

  • 明星产品引爆流量:以Manus为例,其早期凭借“国运级产品”的定位和极高的内测门槛,成功制造了现象级话题。十万元一个的邀请码,不仅是市场对其潜力的疯狂押注,更是一场精心策划的饥饿营销,将产品的稀缺性与价值感推向了顶峰。

  • 资本的非理性繁荣:在热潮之下,资本的涌入近乎“非理性”。据海外AI创业者透露,一个仅有1万日活的Agent产品,便可支撑起1亿美元的估值。这意味着,一个日活用户的价值被炒到了惊人的7万人民币。这种估值模型,显然已脱离了传统的商业价值衡量体系,更多是为未来的可能性支付溢价。

然而,这种由宏大叙事和资本热钱共同催生的繁荣,本身就带有“虚火”的成分。它更多建立在对未来的预期之上,而非对当下价值的坚实肯定。当用户的新鲜感褪去,产品体验的短板暴露无遗时,泡沫的破裂便在所难免。

1.2 商业化的“阿喀琉斯之踵”

如果说资本狂热是Agent赛道的“面子”,那么商业化困境就是其难以回避的“里子”。一个健康的商业生态,必须形成价值创造与价值捕获的闭环。但在当前的Agent市场,这个闭环存在着明显的断裂。

1.2.1 致命的LTV/CAC倒挂

商业模式的成败,往往可以用一个简单的公式来衡量:用户生命周期价值(LTV)必须大于用户获取成本(CAC)。然而,银河证券2025年的报告数据却给出了一个残酷的现实:

  • 高昂的获客成本(CAC):AI Agent行业的平均CAC高达50美元/用户。这背后是激烈的市场竞争、高昂的营销费用以及获取早期高质量用户所需付出的巨大代价。

  • 低迷的生命周期价值(LTV):与之形成鲜明对比的是,平均LTV仅为20-30美元

LTV远低于CAC,形成严重的价值倒挂。这意味着,企业每获取一个新用户,非但不能盈利,反而在持续亏损。这种“流血换增长”的模式在互联网早期或许可行,但在当前资本趋于理性的环境下,无异于饮鸩止渴。它清晰地表明,绝大多数Agent产品尚未找到可持续的盈利路径。

1.2.2 用户价值的“最后一公里”困境

LTV低下的根源,在于产品未能向用户提供足够且持续的价值,导致付费意愿低下和高流失率。

  • 付费意愿的冰点:在国内市场,无论是B端还是C端,用户为纯软件工具付费的习惯尚未完全养成。加之许多Agent产品提供的功能与现有免费工具有所重叠,用户更难被说服打开钱包。

  • 同质化与高流失率:市场上涌现的大量Agent产品,功能大同小异,多是基于大模型API的简单封装,缺乏核心壁垒。这种“千人一面”的状况导致用户在体验几款产品后,很快会感到审美疲劳。一旦发现产品无法稳定解决其实际问题,或体验未达预期,便会毫不犹豫地流失。

这场“元年”的盛宴,看似宾客盈门,实则暗流涌动。当资本的耐心耗尽,当用户的好奇心消退,建立在沙丘之上的楼阁,终将面临坍塌的风险。

二、🧩 结构性困局:技术短板与组织鸿沟的双重枷锁

繁荣之下的虚火,仅仅是表象。更深层次的问题,在于当前AI Agent普遍面临的两大结构性困局:一是源于技术本身尚未成熟的“单点困局”,二是源于企业组织形态未能跟上技术变革的“组织鸿沟”。这两重枷锁,共同限制了Agent从“玩具”到“工具”,再到“生产力引擎”的进化。

2.1 技术瓶颈:“单点赋能”的浅尝辄止

目前市场上绝大多数Agent产品,都停留在“单点赋能”的阶段。它们或许能在某个特定任务上表现出色,比如快速检索信息、生成一份简单的报表,或者自动化一个固定的线上操作。但这种能力是孤立的、碎片化的。

它们缺乏将企业生产链条中多个环节协同整合的能力,无法在复杂的、跨部门的业务流程中扮演“枢纽”角色。究其根源,是技术上的诸多不成熟。

2.1.1 “伪智能”的执行力

一个真正强大的Agent,应当展现出“比人类更懂执行”的可靠性。然而,现实中的许多Agent在面对稍显复杂的任务时,便会暴露出其“伪智能”的一面。

以Manus为例,其在处理涉及多个工具(如文件+邮件+Notion+云盘)的连续任务时,频繁出现问题。不少用户反馈,Manus在执行过程中常常会:

  • 中途卡住:任务执行到一半便无响应。

  • 状态丢失:忘记了前序步骤的上下文信息,导致后续操作错误。

  • 结果错乱:将上一步骤的错误结果传递给下一步,导致整个任务链崩溃。

  • 耗时过长:一个看似简单的多步任务,可能耗时超过一小时,效率远低于人工。

这些问题的本质,反映了当前Agent技术的几大核心短板。我们可以通过下表进行归纳:

表1:AI Agent常见技术短板与表现

技术短板

典型表现

影响

显式记忆机制缺失

多轮任务状态丢失、信息误用

任务失败率高,体验不佳

接口协议不统一

工具调用全靠prompt“蒙”

易出错,难以扩展

推理链条不完善

复杂任务卡顿、耗时长

用户流失,难以规模化

数据接口单一

仅能处理结构化/半结构化数据

适用场景受限

2.1.2 脆弱的“胶水层”

从技术架构上看,现在相当一部分的Agent,其核心只是一个**“胶水层”**。它们的基本工作模式是“一层prompt调用API”,本质上是将用户的自然语言指令翻译成对底层大模型或第三方工具的API调用。

这种架构的脆弱性显而易见。它缺乏一整套结构化的、统一的数据接口,以及与之配套的、稳健的推理链条。当任务需要精确的数据处理和逻辑推理时,这种“胶水层”模式便力不从心。

例如,像扣子空间(Coze)这样的产品,在执行“根据给定数据绘制图表”这类任务时,其完成的状态和质量也往往十分潦草。生成的图表可能格式错误、数据标注不全,甚至完全曲解了用户的意图,远未达到“合格”乃至“可用”的要求。这充分说明,仅靠一个聪明的“大脑”(大模型)和一堆松散的“手脚”(API),而没有强大的“神经系统”(结构化接口与推理链)来连接,是无法完成精密工作的。

2.2 组织鸿沟:当AI撞上“人治”的墙

如果说技术瓶颈是Agent自身的“内伤”,那么组织鸿沟就是其在企业落地时遭遇的“外阻”。一个不容忽视的现实是,当前绝大多数企业的组织架构、工作流程和协作模式,都尚未为迎接AI时代做好准备。

2.2.1 “嵌不进流程”的尴尬

一个典型的例子发生在编程领域。今年上半年,许多企业雄心勃勃地引入了编程类Agent应用Cursor,期望能大幅提升研发效率。然而,最终的反馈却令人失望:此类应用并未带来显著提效

问题出在哪里?不是Agent写代码写得慢,而是企业没有把Agent真正“嵌进流程”里去

在企业的实际运作中,一段代码从诞生到最终上线,需要经历一个漫长且复杂的旅程。理想中,AI Agent应该能实现端到端的自动化,但现实却是另一番景象。这种理想与现实的巨大差距,可以通过下面的流程图清晰地展现出来:

在这个现实流程中,AI Agent(如Cursor)主要作用于C1[人工开发]环节。它或许能将这个环节的时间缩短20%。但真正的瓶颈,往往存在于其他环节:

  • 流程瓶颈:整个“软件交付流水线”仍然是人主导的、审批制的、串联式结构。代码审核可能需要排队等待资深工程师,跨部门的需求澄清可能反复拉扯,测试环境的准备可能耗时良久。

  • 人为因素:流程中60%的瓶颈根本不在编码环节,而在于组织流程和人为因素。沟通不畅、权責不清、审批繁琐,这些“人治”的沉疴,构成了效率提升的最大阻碍。

结果就是,AI带来的那20%的局部优化,在整个流程的巨大惯性面前,几乎被完全抵消,最终化为乌有。这深刻地揭示了一个道理:生产工具的革命,必须与生产关系的变革相匹配,否则便无法释放其全部潜力。

2.2.2 POC的“死亡之谷”

“嵌不进流程”的尴尬,最终导致了大量AI项目陷入了POC(Proof of Concept,概念验证)的“死亡之谷”。企业投入资源做了很多小范围的试点,验证了技术在理论上的可行性,但这些项目却迟迟无法进入大规模部署和使用的阶段。

根据知名咨询公司ThoughtWorks的报告,这一现象极为普遍:

高达88%的AI POC项目,最终都因业务协同不足与运营成本高昂,而未能进入大规模部署。

研究进一步发现,平均每家公司推出的33个AI概念验证项目中,只有4个能够最终进入生产阶段。这意味着绝大多数的AI投入,都停留在“看起来很美”的试验阶段,未能转化为真实的生产力。

这双重的枷锁——技术上的不成熟与组织上的不匹配——共同构成了AI Agent在2025年所面临的核心困局。不打破这两重枷锁,Agent就永远只能是少数极客的“玩具”和企业PPT里的“未来展望”,而无法成为推动社会进步的可靠引擎。

三、🧭 Agent分野:通用的“宽路”与垂直的“窄门”

赛博朋克画面设计 (1) 拷贝.jpg

面对技术与组织的双重困局,AI Agent的创业者们站在了一个关键的十字路口,面前是两条截然不同、却同样充满诱惑与挑战的道路:一条是通向“AI操作系统”宏大愿景的“通用”宽路,另一条是深耕行业痛点、解决具体问题的“垂直”窄门。

3.1 通用Agent的“海市蜃楼”

在2025年涌现的Agent浪潮中,绝大多数明星产品,包括Manus、GenSpark和扣子空间,都不约而同地选择了“通用Agent”这条路线。这背后的逻辑不难理解。

3.1.1 性感的叙事与资本的偏爱

“通用”二字,本身就充满了魔力。

  • 想象空间巨大:与垂类Agent相比,“通用”的概念听起来无疑更性感。对投资人而言,“打造一个AI时代的操作系统”的故事,其吸引力远非“开发一个HR报销助手”所能比拟。前者是平台级、生态级的梦想,后者只是一个工具级的应用。

  • 用户心智的抢占:“全能型”的愿景更容易在早期吸引大众用户的眼球。一个能帮你处理生活中一切事务的AI助理,听起来更先进、更全能,也更能制造出病毒式传播所依赖的FOMO效应。

然而,宏大的愿景与骨感的现实之间,存在着一条难以逾越的鸿沟。当前的通用Agent,其技术形态更像一个智力尚可、但情商与权限皆不足的虚拟助理。它或许能帮你完成一些指令清晰的简单任务,但远未达到胜任系统调度、权限管理、资源协调等操作系统核心职能的水平。

3.1.2 个人用户的“尴尬处境”

对于个人用户而言,通用Agent目前的处境颇为尴尬。它试图解决的,往往是那些琐碎的、非刚需的事务,例如点外卖、订酒店、做一份简单的生活规划。

这些需求的痛点本身并不深。它们通常不紧急、评估标准模糊、且决策过程复杂。用户在这些场景中,更关注的往往是“心态”与“体验”,而非纯粹的“效率”。

一个绝佳的例子就是点外卖。对于大多数人来说,点外卖的真正痛点不是“下单速度慢”,而是“不知道吃什么”。这个决策过程涉及到个人口味、近期偏好、优惠活动、他人评价等一系列复杂且感性的因素。人们享受的是浏览、比较、选择的乐趣。一个Agent即使能在一秒钟内帮你下好单,也无法解决这个核心的决策难题。它提升的效率,并非用户真正关心的价值所在。

当一个产品试图解决一个“伪痛点”时,其商业价值自然也就大打折扣。

3.2 垂直Agent的“窄门”与“窄门”内的风景

与通用Agent的“虚火”形成鲜明对比的,是一些专注于“专、窄、深”的垂直领域,聚焦于解决企业具体痛点的AI Agent。它们虽然朴实无华,却在2025年获得了实实在在的商业成功。

3.2.1 创造可量化的商业价值

垂直Agent的成功,在于它们不讲宏大叙事,只专注于为企业客户创造可量化、可衡量的商业价值(ROI)

  • 金融行业:Muffintech,一个专注于保险行业的客服Agent。它能自动处理保单状态查询等常见问题,回复准确率高达98%。更重要的是,它将过去需要数天甚至数周的理赔审批时间,缩短到了惊人的1天。这为保险公司每年直接节省了500万美元的运营成本。

  • 法律行业:Harvey,一个聚焦于法律文书起草的Agent。它精准地切入了律师行业的核心痛点:手动进行案例研究耗时长(平均每案20小时)、文书起草错误率高。Harvey能够自动分析海量法律案例和法规,生成高质量的研究报告,准确率达到90%。这为律所带来了肉眼可见的效率提升和风险降低。

这些成功的案例,共同指向了一个朴素的商业真理:技术只有与具体的业务场景深度结合,解决真实的痛点,才能创造出不可替代的价值。

3.2.2 窄门背后的三重壁垒

然而,这条通往真实价值的“窄门”并不好走。垂类Agent的成功,并非任何一家企业都能轻易照搬。其背后,是常人难以逾越的三重高墙。

  1. 数据的壁垒:垂直领域需要海量的、高质量的、且往往是非公开的行业数据来进行模型微调或重新训练。例如,制造业的Agent需要理解复杂的传感器数据,医疗Agent需要读懂晦涩的病历和影像报告。这些数据的获取门槛极高,本身就是一道护城河。

  2. 人才的壁垒:垂类Agent的开发,需要的是复合型人才。团队成员不仅要精通AI技术,更要对特定行业有深刻的理解和洞察(Know-How)。一个既懂Transformer架构又懂国际贸易法的人才,其稀缺性和招聘成本可想而知。

  3. 集成的壁垒:企业级的Agent必须与客户现有的IT系统(如SAP、Salesforce、ERP)实现无缝对接,才能打通数据、优化流程。然而,许多企业内部存在严重的数据孤岛问题。跨系统集成需要开发大量定制化的API,这对团队的系统架构设计和行业软件集成经验提出了极高的要求。

这三重壁垒,使得大部分缺乏深厚行业积累和技术实力的中小企业,难以打造出有竞争力的垂类Agent。

3.3 大厂的“转身困境”

一个有趣的现象是,在垂类Agent这个赛道上,我们并没有看到互联网大厂(如BAT、字节)的身影占据主导地位。它们推出了诸如阿里的“钉钉+夸克”、百度的“千帆App Builder”等平台级产品,但真正深入到某个复杂垂直行业,完成端到端业务流程改造的标杆案例却寥寥无几。

究其原因,在于大厂的基因与垂类业务的属性存在天然的“错配”。

  • 基因错配:互联网大厂更擅长做的是“通用能力+流量和平台”。它们的优势在于规模化、标准化和快速迭代。

  • 业务属性错配:而垂类Agent的成功,恰恰需要的是深入线下,去做那些**“脏活、累活”**,包括繁琐的定制开发、严格的合规适配、以及漫长的实施部署。这些工作无法标准化,难以规模化,且需要极大的耐心和行业深耕。

  • 考核体系错配:大厂的业务属性、考核体系和商业动力,都决定了它们更倾向于追求高举高打、快速见效的平台型业务,而不是这种需要“结硬寨、打呆仗”的垂直深耕。

这种“转身困境”,为深耕垂直领域的创业公司留下了宝贵的时间窗口和市场空间。

四、🌍 跨越市场鸿沟:出海、本土与终局之战

除了技术与组织层面的结构性困局,所有Agent产品自诞生之日起,便面临着一个无法回避的商业化难题——国内与国际市场的深度割裂。这迫使创业者们必须在“出海求生”与“本土验证”之间做出艰难的抉择。

4.1 国内市场的“双重枷锁”

对于立足于国内市场的AI Agent创业者而言,他们头顶悬着两把“达摩克利斯之剑”。

4.1.1 模型能力的“代际差距”

受限于合规性要求,国内的AI应用发展高度依赖国产大模型的能力。尽管国产模型在近年来取得了长足进步,但与美国顶尖模型(如OpenAI的GPT系列、Anthropic的Claude系列)之间,客观上仍存在代际差距

这种差距体现在多个方面:

  • 复杂推理链条:在处理跨领域、多条件的复杂逻辑推导时,Claude Opus 4等国外先进模型能保持更稳定的逻辑一致性,出错率更低。

  • 超长上下文窗口:国外顶尖模型已支持百万级别的上下文长度,这使得它们在处理长篇文档、分析完整代码库等任务时游刃有余。

  • 结构化输出稳定性:在严格按照指定格式生成长且结构化的内容(如JSON、代码、报告)方面,国外模型的稳定性和可靠性也更胜一筹。

这些能力上的差距,直接限制了国内Agent产品所能达到的性能天花板。创业团队需要付出更大的努力,在场景设计、数据工程、模型调优等多个层面进行弥补,才能追平与国外同类产品在用户体验上的差距。

4.1.2 市场付费意愿的“价值鸿沟”

另一个更为现实的挑战,是国内市场整体偏低的付费意愿。受限于整体数字化程度与长期的消费习惯,无论是B端企业还是C端个人用户,为纯软件服务付费的意愿都相对不理想。

这使得消费级的AI应用,尤其是初创产品,其价值更难以被市场充分认可并实现商业化。在“高投入、低价值”的双重压力下,许多团队的生存空间被急剧压缩。

4.2 出海的“求生之路”与“断供”危机

在本土市场举步维艰的背景下,“出海”成为了许多Agent产品(包括Manus)情理之中的选择。

海外市场,尤其是北美市场,展现出了截然不同的商业环境。更高的用户付费意愿、更成熟的SaaS生态,以及对AI产品更慷慨的估值体系,为出海企业提供了一片看似广阔的蓝海。

然而,出海并非一劳永逸的终极解药,它更像是一场**“活下去+练能力”的阶段性策略**,而非“一去不返”的终局。所有出海的Agent产品,都无法逃脱一场终极考验——模型能力的比拼与平台风险

随着2025年OpenAI、Anthropic等大模型巨头纷纷开始布局自有的Agent产品,一场“降维打击”正在酝酿。为了保持自身的竞争优势,巨头们随时可能挥起“模型断供”的大棒。

前段时间发生在海外的著名AI编程应用Windsurf身上的遭遇,便是一个血淋淋的警示。作为Claude模型的重度使用者,Windsurf在一夜之间遭到了Anthropic的全面断供,公司瞬间陷入生存危机。这一事件,深刻揭示了所有没有自研核心模型、仅仅做“套壳”应用的Agent企业,在平台巨头面前的极端脆弱性。

4.3 本土价值的再验证:从“托底”到“变革”

尽管前路漫漫,但国内市场也并非一片荒芜。资本的耐心或许有限,但真实的市场需求正在浮现。

可以肯定的是,目前的AI Agent已经在一些流程明确、规则固定的场景里,切实展现出降本增效的价值。例如:

  • 智能客服:自动回答重复性问题,7x24小时在线。

  • 营销内容生成:批量创作营销文案、海报。

  • 数据分析与报表:自动化处理数据、生成可视化图表。

这些商业化场景,为Agent赛道提供了坚实的“托底”,证明了它在今年绝非一个纯粹的“泡沫”。IDC的调研数据也印证了这一趋势:2025年,中国工业企业中AI Agent的应用比例,预计将从2024年的9.6%显著提升到47.5%,这表明其在企业端的落地正在加速。

而未来更大的商业化突破,则有待Agent在某些高价值的垂类领域,例如金融风控、医疗诊断、新药研发等场景,真正发挥出变革性的作用。

结论

2025年,AI Agent的“元年”,既是技术与产业的爆发期,也是虚火与泡沫的洗牌期。通用Agent的宏大故事虽然动听,但在当前的技术和商业环境下,更像是一座遥远的海市蜃楼。真正的价值,蕴藏在那些看似不起眼的垂直场景之中。

创业者们必须清醒地认识到,唯有放弃对“全能”的幻想,深入到具体的行业肌理中,用技术去解决那些真实存在的、棘手的业务问题,才能在这场残酷的淘汰赛中幸存下来。

穿越技术、组织、市场这三重“窄门”的过程,无疑是痛苦而漫长的。但只有走过这条窄路,AI Agent才能真正从一个被热议的概念,蜕变为推动社会进步的强大引擎。最终实现商业价值的创造,需要技术、组织和产业生态的协同演进,如下图所示:

这,既是AI Agent的困局,也是它的突围之道。

📢💻 【省心锐评】

元年热潮退去,方显英雄本色。Agent的未来不在于通用叙事的宏大,而在于垂直深耕的价值。放弃“造神”,回归“造物”,方能行稳致远。