【摘要】AI产品开发的范式正在经历一场深刻变革。成功的AI产品不再依赖于传统的自上而下规划,而是通过与模型深度互动,从底层自发涌现。这种“自下而上”的演进路径,正在重塑我们对创新、组织效率和人机协作的理解。
引言
在科技圈,Mike Krieger 这个名字与“产品”二字紧密相连。作为 Instagram 的联合创始人兼前 CTO,他亲手打造了一款定义了移动互联网时代视觉社交的产品。如今,他的身份是 Anthropic 的首席产品官(CPO),一家站在大模型技术浪潮之巅的公司。从像素构成的照片墙到由语言模型驱动的未来,Krieger 的视角转换,本身就预示着产品开发哲学的剧变。
最近,他在红杉资本的一次分享,与其说是一场演讲,不如说是一次坦诚的复盘与展望。他谈论的,正是当前所有产品经理、工程师和创业者都无法回避的核心问题,在AI时代,我们该如何构建真正有价值的产品?他给出的答案有些反直觉,最好的AI产品,似乎并不能被精确地“计划”出来。它们更像是在实验室的培养皿中,从最基础的交互和实验里,自发地“长”出来。这篇文章,将基于他的分享,深入探讨这场由AI引发的产品开发革命,以及它对组织、协作和创新带来的深远影响。
一、AI 生成内容的未来,不是真假之辨,而是可信与共鸣
在讨论如何构建AI产品之前,我们必须先厘清一个基础背景,AI正在创造一个怎样的信息环境?
过去几年,每当AI生成内容的技术有所突破,公众的讨论焦点总会迅速滑向“真假”的二元对立。“这张图片是AI画的吗?”“这段文字是AI写的吗?”这类问题不绝于耳。甚至在学术界,AI查重也成了一种新的“猫鼠游戏”。
但 Krieger 提出一个颇具前瞻性的观点,长期来看,当绝大多数内容都由AI生成或辅助生成时,“是不是AI生成的”这个问题本身将变得毫无意义。 这就像在印刷术普及后,我们不再纠结一本书是手抄的还是印刷的。
真正重要的问题会转变为其他维度。
来源(Provenance),这段内容的原始出处是哪里?它基于哪些数据训练而成?
溯源(Traceability),我能否追溯它的生成路径和修改历史?
引用(Citation),它是否清晰地标注了所引用的信息来源,以便我进行事实核查?
有趣的是,AI本身恰恰可能是解决这些问题的最佳工具。过去,区块链技术曾被寄予厚望,希望通过分布式账本解决数字世界的可信度问题。但现实是,区块链的应用场景和效率都遇到了瓶颈。而在一个内容生产链条完全数字化的今天,AI模型反而能更高效地完成溯源和验证工作。
想象一下,未来的每一份AI生成文档,都可能内嵌一个“数字身份证”,记录了它的“父母”模型、训练数据集、关键的Prompt以及所有引用的外部链接。当你对某个观点产生疑问时,可以一键追溯到它的源头。未来的内容消费,重点不再是分辨“人造”与“机造”,而是判断“它是否可信”、“它来自哪里”、“我能否验证它”。
这种转变意味着,未来AI产品的核心竞争力之一,将是构建强大的内容可信度体系。无论是通过技术手段(如数字水印)还是产品设计(如清晰的引用和溯源功能),帮助用户在信息的汪洋大海中建立信任,将是所有内容型AI产品的必修课。
二、真正有价值的 AI 产品,从不是计划出来的
这或许是 Krieger 分享中最具颠覆性的观点。它直接挑战了过去二十年互联网产品开发的“金科玉律”。
2.1 从“自上而下”到“自下而上”的范式转移
在 Instagram 的黄金时代,产品开发是一套严谨的、可预测的流程。Krieger 回忆,他们会制定详尽的三到六个月的产品路线图(Roadmap)。团队像一支训练有素的军队,从顶层战略出发,层层分解为功能、指标、设计稿和开发排期。这是一种典型的**“自上而下”(Top-down)**模式。它在功能明确、用户需求相对稳定的市场中非常有效。
然而,在 Anthropic,这套方法论失灵了。Krieger 发现,无论是他们自己,还是像 OpenAI 这样的同行,那些最酷、最有影响力的AI产品,几乎都不是在会议室里规划出来的。它们诞生于一种更混沌、更有机的方式,“自下而上”(Bottom-up)。
这种模式的核心在于,产品的真正潜力,只有在与模型本身进行极度深入和频繁的互动实验后,才会逐渐显露出来。 你无法预先设计一个完美的AI功能,因为你甚至不知道模型能力的边界在哪里。你必须先“玩”起来,把模型推向极限,观察它在各种意想不到的场景下的反应。那些“惊喜”的瞬间,往往就是伟大产品的起点。
比如 Anthropic 的 Artifacts 功能,它允许 Claude 将代码、文本块等生成内容放置在一个独立窗口中,方便用户编辑和使用。这个功能最初只是一个内部研究员做出的粗糙原型,目的是为了解决自己在编程时的一些不便。后来,设计师和工程师看到了它的潜力,接手进行优化和打磨,最终才演变成一个正式的产品功能。整个过程,没有详细的PRD(产品需求文档),没有严格的排期,更像是一场接力赛。
2.2 The Birth of an Idea The MCP Story
Model Component Protocol(MCP)的诞生故事,是“自下而上”模式的绝佳注脚。
故事的开头平淡无奇。团队需要让 Claude 能够接入外部知识,最初的两个目标是 Google Drive 和 GitHub。工程师们很快发现,尽管目标都是“把上下文引入模型”,但两个功能的内部实现方式截然不同。紧接着,第三个集成的需求又来了,大家预感到,这又将是一次“重复造轮子”的开发。
这时,两位工程师觉得“这样做不合理”。按照软件工程的古老智慧,“做三次之后,就可以总结出抽象层级,形成标准”。他们没有去写一份长篇大论的提案,申请立项,而是直接动手做了一个原型,试图找到一种统一的方式来处理这类外部工具的调用。
这个“小火花”,就是 MCP 的雏形。它并非源于一个“我们要制定行业标准”的宏大叙事,而是源于一线工程师对代码优雅和效率的追求。
后来,这个内部协议逐渐被完善,团队也意识到它的巨大潜力,开始投入更多精力将其打磨得更开放、更通用,并希望它能成为整个行业的基础设施。如今,MCP 真的开始被更广泛地采用。从解决一个具体问题,到一个内部标准,再到一个行业协议,MCP 的演化路径完美诠释了什么叫“从底层自发长出来”。
2.3 从涌现到执行,Agent 的未来蓝图
一个好的想法“长”出来之后,如何培育它?Krieger 认为,围绕 MCP 的下一步,有两个关键方向。
第一个是**“执行能力”**。MCP 最初的设计目标是引入上下文,让模型“知道”更多。但未来,模型不仅要能“理解”,更要能“行动”。通过 MCP,模型应该能主动触发 Zapier 的工作流,能在 GitHub 里提交代码,能自动完成一系列预设任务。这是从“信息输入”到“任务执行”的质变。
第二个是**“Agent 之间的协作”**。这是更长远的畅想。当大量的 AI Agent 都能独立执行任务时,它们之间必然会产生交互。一个 Agent 可能会为了完成一个复杂任务,去“雇佣”另一个更专业的 Agent。比如,你的个人写作 Agent 可能会调用一个数据分析 Agent 来获取图表,然后再调用一个设计 Agent 来完成排版。这将催生一种全新的、由 AI 构成的经济系统。
这些方向并非凭空规划,而是在 MCP 这个“自下而上”的产物基础上,自然延伸出的可能性。
2.4 The Paradox of "Vibe Coding"
编程领域是 AI 应用最成熟的场景之一,但即使在这里,Krieger 依然认为创新充满了不确定性。
“Vibe Coding”是一个社区创造的词,用来形容一种编程体验,你不再是逐字逐句地写代码,而是向AI描述你的“感觉”或“意图”,AI则为你生成代码。这种方式在做一些小项目或寻找灵感时非常有趣,充满了探索的乐趣。
但问题在于,构建一个需要百人团队协作的大型、稳定、可维护的工程系统,光靠“Vibe”是远远不够的。Anthropic 内部,超过 70% 的代码合并请求(Pull Request)是由 Claude 生成的。这极大地提升了开发速度,但也带来了新的、更棘手的问题。
代码审查怎么办? 你可以用 Claude 来审查 Claude 生成的代码,但这就像一个“套娃”,每一层都是AI。我们如何确保整个技术架构的健康和可控?我们是否在以一种前所未有的速度,累积一种全新的“技术债”?这些问题,整个行业都还在摸索答案。
2.5 The New Bottleneck
AI 带来的效率提升,像一面放大镜,照出了组织中那些原本被容忍的低效环节。
Krieger 观察到一个深刻的现象,当AI将工程师的编码效率提升数倍后,组织中那些“非工程环节”的瓶颈变得异常刺眼。
过去,一个冗长的对齐会议,可能只是耽误了一位工程师一小时的工作。现在,这一小时的会议,可能等于耽误了“8小时的AI产出”。工程师们会感到前所未有的挫败感,因为他们刚刚还在以光速生成代码,转眼就陷入了缓慢的决策流程和部门协调的泥潭中。
AI 优化了执行的“点”,却放大了协作的“面”上的问题。 组织流程中的不协调、沟通的模糊地带、决策的犹豫不决,这些“软问题”成为了限制整体效率的最大障碍。虽然 AI 模型可以帮助总结会议纪要、提炼下一步行动建议,但它们还无法代替人类做出复杂的、涉及权衡和判断的组织决策。这预示着,下一阶段 AI for Work 的重点,可能将从赋能个体转向优化整个组织的协作流程。
三、从工具到协作,组织如何适应 AI 时代的效率重构
当一个颠覆性工具出现时,它的普及不仅是技术问题,更是文化问题。Anthropic 内部推广使用 Claude 的过程,生动地展示了这种文化的演变。
3.1 打破“AI 使用羞耻感”
Krieger 最乐于见到的,是非技术团队,比如销售团队,开始主动拥抱大模型。他们会用 Claude 来准备客户会议的资料,模拟客户可能会提出的问题。当他们在使用过程中遇到障碍时,产品团队会根据这些具体的需求,为他们开发专属的内部工具。这种由真实需求驱动的工具开发,远比自上而下的推广要有效。
然而,即便是在 Anthropic 这样的顶尖AI公司,员工使用AI的能力也参差不齐。有人已经把 Claude 当作不可或缺的“思维合伙人”,而另一些人则依然固守传统的工作流程。
一个有趣的转折点发生在绩效季。起初,很多员工在写绩效评语或工作总结时,内心会有一个声音在问,“我能用 Claude 生成初稿吗?这是不是在‘作弊’?”这种“AI使用羞耻感”是真实存在的。
但公司文化的变化悄然发生。管理层开始公开鼓励这种用法,传递的信息是,AI 是一个帮你节省时间的杠杆,而不是代替你思考的捷径。 你当然需要对AI生成的内容进行校对、修改,并注入自己的判断和思考。但如果它能帮你节省两个小时的重复性写作,让你能把时间花在更重要的战略思考上,那为什么不用呢?
更具戏剧性的一幕是,Anthropic 有一个内部工具,可以打通 Slack 和所有内部文档。员工们发现,在绩效季,很多人开始在这个工具的公共频道里,用它来生成评语初稿。这种“共享式使用”的行为艺术,意外地起到了奇效。当大家看到同事们都在公开地、坦然地使用AI辅助工作时,那种“偷偷作弊”的感觉就消失了。
这让人想起 Midjourney 刚兴起时,Discord 频道里充满了人们分享自己生成作品的热情。这种“可见性”,是推动一项新技术融入日常工作流程的关键催化剂。 它将个体的使用行为,转变为一种群体认同的文化现象。
3.2 The Uneven Adoption Curve
Krieger 的坦诚在于,他承认了AI应用在组织内部的不均衡性。这给所有希望在团队中推广AI工具的管理者提了个醒,仅仅提供工具是不够的。
识别“超级用户”,发现那些使用AI最深入、最有创意的员工,让他们分享自己的工作流和技巧。
场景驱动,而非功能驱动,不要只是培训员工“如何使用AI”,而是展示“如何用AI解决某个具体的工作任务”,比如“如何用AI在半小时内完成一份周报初稿”。
降低使用门槛,对于非技术人员,提供更简单、更定制化的工具,而不是让他们去学习复杂的 Prompt Engineering。
AI 的普及,不是一条平坦的直线,而是一条需要耐心培育和引导的曲线。
3.3 “思维合伙人”范式
Krieger 本人就是AI的重度用户。他将 Claude 定义为自己的“思维合伙人”(Thought Partner)。无论是撰写战略文档、制定产品规划,还是给团队成员写评语,他的第一步都是先和 Claude 进行一轮“脑力激荡”。
他用了一个生动的比喻,“就像有了 GitHub Copilot 之后,我在没有它的飞机上会感觉自己不会写代码了一样,我现在也很难回到没有AI协助的写作状态了。”
这种依赖,并非能力的退化,而是一种工作模式的升级。它将人类的优势(战略思考、价值判断、创造性联想)与AI的优势(信息处理、结构化写作、快速生成)结合在一起。AI负责搭建脚手架和填充砖块,而人则负责设计蓝图和最终的精装修。
这种“人机协作”的模式,正在重新定义“生产力”的内涵。
四、AI Agent 正在成为下一代“数字员工”
如果说当前我们对AI的应用还停留在“工具”层面,那么 Anthropic 的下一个目标,可以用一个词来概括,Agent。
这个词现在几乎被用滥了,但 Krieger 描绘的蓝图更加具体。Anthropic 的目标不是去构建生态中的每一个 Agent 应用,而是为这种全新的“数字员工”形态,提供最坚实的底层支持。代码生成只是一个起点,它验证了一个更宏大的命题,模型能否像人类一样,连续工作几个小时甚至更长时间,自主地完成一个复杂项目?
要实现这个目标,光靠提升模型的参数量和推理能力是不够的。它需要一整套全新的配套系统。
记忆能力(Memory),Agent 必须能记住自己做过什么,学到了什么,以及在长任务中的上下文。它不能每隔几分钟就“失忆”。
高级工具调用(Advanced Tool Use),它不仅要能调用一个简单的搜索API,还要能熟练使用像 GitHub、Jira、Figma 这样复杂的专业软件,甚至与真实世界的硬件交互。
自动适应组织结构(Organizational Awareness),当一个 Agent 被“部署”到一家公司时,它需要能理解这家公司的组织架构、汇报关系和沟通规范。它要知道该向谁请求权限,该把报告发给哪个部门。
可验证性与日志记录(Verifiability & Logging),想象一家公司同时运行着 100 个 AI Agent。管理者如何监管它们的行为?如何审计它们的决策过程?如何确保它们的操作符合公司的合规要求?这需要一套强大的日志和审计系统。
这四个支柱,共同构成了 Agent 从一个“聪明的聊天机器人”进化为“可靠的数字员工”的基石。
五、前路上的反思与挑战
在分享的最后,Krieger 回答了一些来自观众的尖锐问题。这些问答,更像是他对当前AI产品领域最真实、最坦诚的思考。
5.1 The Usability Gap
当被问及作为产品负责人最头疼的问题时,Krieger 的回答直指要害,AI 产品对新手来说,仍然太难用了。
模型的能力已经强大到令人惊叹,但能真正用好这些能力的用户,依然是少数。AI 产品远没有达到像 Instagram 那样“开箱即用”的程度。你第一次打开 Instagram,本能地就知道该拍照、加滤镜、然后发布。但你第一次打开一个大模型应用,往往会陷入“我该问它什么”的茫然。
只要用户的使用路径稍微偏离了产品设计者预设的“最佳实践”,模型输出的效果就会大打折扣。这种“脆弱性”是当前所有AI产品的通病。如何设计出更具引导性、容错性更高的交互体验,让普通用户也能轻松释放模型的潜力,是摆在所有产品经理面前的巨大挑战。
5.2 The Compute Conundrum and Strategic Delays
关于一篇名为《AI 2027》的热议文章,其中提到AI公司可能会“故意推迟模型发布”以最大化商业回报,Krieger 分享了他的看法。
他首先承认了算力的核心地位。这早已不是秘密。每家AI公司的最高层会议,几乎每天都在讨论算力问题,我们有多少储备?下一代芯片用谁的?和哪家云厂商合作?这决定了公司的生死。
而“延迟发布”的争论,则触及了一个更深层次的战略权衡。扎克伯گ在访谈中也提到过类似的困境,你是应该把宝贵的算力投入到为现有 LLaMA 模型开放 API 服务,满足用户需求,还是应该把这些算力保留下来,用于下一代模型的强化学习(RL)训练?
这是一个艰难的选择。前者能带来立竿见影的收入和用户反馈,后者则可能孕育出颠覆性的架构突破。Krieger 个人的倾向是,尽早让模型进入真实市场。他认为,Claude 3.5 系列之所以能做得这么好,很大程度上得益于从海量真实用户反馈中获得的快速迭代。如果一个模型只在实验室里闭门造车,它可能会在理论测试中得分很高,却无法真正解决现实世界的问题。
5.3 Bridging Research and Product
在一个既有顶尖研究团队又有产品团队的大型组织里,如何平衡两者的关系?
Krieger 对自己的产品团队提出了一个尖锐的问题,“如果我们做出的产品,只是把一个 API 模型包装了一下,功能还和别家大同小异,那我们存在的价值是什么?”
他强调,产品团队的使命,是将公司最顶尖、最独特的研究成果,转化为用户可感知的、有价值的产品体验。如果做不到这一点,就是对研究资源的巨大浪费。Artifacts 是一个正面案例,它是一个专门为 Claude 的独特能力进行微调和优化的产品,因此体验非常好。
他也坦承,Anthropic 曾经历过产品和研究脱节的阶段。现在,他们正在努力回归,重新强调“产品 = 模型核心能力 + 独特的交付方式”。目前,大约只有 10% 的研究人员深度参与到产品开发中,这个比例还需要提高。
5.4 The Agent Communication Dilemma
关于未来 Agent 之间交流协议的标准化,Krieger 指出了一个尚未解决的核心难题,Agent 要不要透露信息,以及透露多少?
这是一种极其细腻的判断。比如,你的个人财务 Agent 在与银行的 Agent 交互时,可以透露你的信用卡信息。但当它与一个陌生的、第三方的营销 Agent 互动时,就必须保护你的隐私。这种“什么该说,什么不该说”的判断力,目前还没有被很好地训练出来。
模型的天性是“讨好”用户,这让它们倾向于透露过多信息。但如果通过指令让它变得过度保守,它又可能什么都不说,无法完成任务。如何在这种微妙的平衡中找到最佳点,既是一个产品设计问题,也是一个前沿的研究课题。
5.5 Common Pitfalls in AI Application Design
最后,对于正在开发AI应用层产品的同行,Krieger 指出了两个常见的“坑”。
第一个是**“外挂式AI”**。很多产品是从“轻AI”开始的,他们只是在现有产品的边栏加一个AI助手的入口。当产品功能越来越依赖AI时,这种“外挂”式的结构就会成为体验的瓶颈。正确的做法是,从底层重新构建产品,让AI成为产品的“第一用户”或核心组件,而不是一个附加功能。
第二个是应用没有为AI提供足够多的“操作抓手”。当你让模型帮你完成一个任务,它回答“我做不到”时,问题可能不在于模型能力不行,而在于你根本没有设计好相应的接口(API)让它去调用。很多开发者习惯于先设计图形用户界面(GUI),再把AI“贴”上去。但未来的设计思路应该是反过来的,先思考AI Agent会如何使用你的产品,为它设计好完备的接口,然后再去构建人类用户的界面。
总结
Mike Krieger 的分享,为我们描绘了一幅AI产品开发的全新图景。在这幅图景中,严密的计划和路线图正在褪色,取而代之的是一种拥抱不确定性、鼓励实验和自下而上涌现的文化。伟大的AI产品,不再是被设计出来的“机器”,而是被培育出来的“生命体”。
它要求产品团队更贴近模型,像生物学家一样去观察和理解它的习性;它要求组织打破壁垒,让研究、工程和设计更紧密地协作;它更要求我们重新思考效率、协作和创新的本质。从内容的可信度,到组织的瓶颈,再到人机协作的文化,AI正在以一种不可逆转的方式,重塑着我们创造价值的全过程。
这条路没有现成的地图,但方向已经逐渐清晰。最好的AI产品,或许真的无法被计划,但它们一定诞生于那些最勇敢、最深入的探索之中。
📢💻 【省心锐评】
AI产品开发,不再是画一张精确的建筑蓝图,而是培育一片充满未知的雨林。产品经理的角色,从建筑师,变成了那个最有耐心和洞察力的园丁。
评论