【摘要】奥特曼访谈揭示AI时代工作本质的演变,深入剖析了从“零人公司”到AGI科学发现的路径,并详解了GPT-6、Sora商业模式及未来多模态交互的战略蓝图。
引言
在人工智能技术浪潮席卷全球的今天,OpenAI CEO山姆·奥特曼(Sam Altman)的一句话,如同一块巨石投入平静的湖面,激起了千层浪。“能被ChatGPT消灭的工作不是真正的工作”,这句看似耸人听闻的论断,出自他与Rowan Cheung的最新访谈。它不仅迅速点燃了关于职业价值与未来生存的社会大讨论,更深层次地,它揭示了奥特曼以及OpenAI对于技术、工作与人类未来关系的深刻思考。
这次长达半小时的对话,信息量巨大。它不只停留在哲学层面的探讨,更是对OpenAI未来产品路线图的一次全面展示。从Agent Builder引发的“零代码革命”,到对“零人公司”的畅想;从坦然面对GPT模型在GDPval基准测试中的排名,到对GPT-6研发策略的阐述;从AGI定义标准的悄然转变,到Sora视频模型背后复杂的商业模式考量。奥特曼的分享,如同一幅徐徐展开的画卷,描绘了一个AI与人类深度共融,并不断重塑现实边界的未来。
这篇文章将不仅仅是对访谈内容的简单复述。我们将深入挖掘其背后隐藏的技术逻辑、商业雄心与哲学远见,试图为你完整解析奥特曼这盘棋的全局。我们将探讨,当AI开始进行科学发现时,AGI的曙光究竟还有多远?当Sora这样的工具普及,内容创作的生态将如何被颠覆?以及最重要的,当我们谈论“真正的工作”时,我们究竟在谈论什么?
一、📜 “真正的工作”与技术浪潮下的哲学思辨
奥特曼的核心观点,始于一个引人深思的历史类比。他让我们想象一个场景,如果回到50年前,去告诉一位终日劳作的农民,未来世界将诞生十亿个基于互联网的新岗位,比如社交媒体运营、在线主播或是算法工程师,他们会作何感想?
1.1 工作定义的动态演化
奥特曼的答案是,那位农民不仅不会相信,甚至可能会觉得我们口中的这些“工作”——根本算不上是真正的工作。
在他的世界观里,“种地是在提供人们真正需要的东西,养活他们,这才是真正的工作。” 相比之下,现代社会中,许多生活在物质极大丰富环境下的知识工作者,所从事的很多事情更像是一种“需要感到重要的、打发时间的游戏”。
这个类比并非为了贬低任何职业,而是为了揭示一个深刻的道理,“工作”的定义从来不是静态的,它随着生产力的发展和社会结构的变化而持续演化。每一次颠覆性的技术革命,都会淘汰一批旧有的工作形态,同时催生出我们曾经无法想象的新职业。
奥特曼的观点是,AI正在扮演工业革命中蒸汽机、信息革命中计算机的角色。它所“消灭”的,是那些可以被高度自动化、遵循固定模式的重复性任务。而人类的独特价值,恰恰在于那些无法被轻易量化和复制的能力。
1.2 人类内在驱动力的恒定
那么,当大量现有工作被AI取代后,人类会陷入无所事事的境地吗?奥特曼对此持乐观态度。他相信,人类的内在驱动力——好奇心、创造欲、探索未知的冲动以及对社会连接的需求——是恒久不变的。
未来的工作可能会呈现出与现在截然不同的形态,或许更轻松,或许更侧重于创造和情感体验。但我们总会找到新的、有意义的事情去做。这种工作形态的持续迁移与重构,是技术进步的必然结果。与其为旧工作的消逝而焦虑,不如思考如何在新的生产力范式下,找到人类价值的新坐标。
这引出了一个核心问题,在AI时代,人类的不可替代性究竟体含现在哪里?奥特曼的访谈并未直接给出答案,但他的思考贯穿始终,指向了以下几个方向:
提出正确的问题,AI擅长寻找答案,但定义问题、设定目标仍是人类的核心能力。
复杂的价值判断与伦理决策,尤其是在模糊和充满不确定性的领域。
深度的共情与人际连接,这是构建社会信任与协作的基石。
突破性的原创思想与艺术创造,源于人类独特的生活体验和情感世界。
因此,奥特曼的“工作消亡论”,实质上是一次对“人类价值”的重新呼唤。他敦促我们思考,当AI接管了“劳动”,我们应该如何更好地去“工作”和“创造”。
二、🚀 从“零代码”到“零人公司” AI重塑商业版图
如果说对“真正工作”的探讨还停留在哲学层面,那么奥特曼对AI如何重塑商业实践的描述,则充满了具体而震撼的细节。他认为,一场由AI驱动的、深刻的商业变革已经开始,其核心在于生产工具的极致民主化。
2.1 Agent Builder与“零代码革命”
奥特曼在访谈中毫不掩饰对 Agent Builder 的兴奋。他将其描述为一次“地壳变动”。回顾两年前的第一个Dev Day,当时模型的能力与现在相比,差距巨大。而如今,借助强大的模型底座,Agent Builder已经实现了惊人的飞跃。
他描述了一个典型的场景,一个普通的知识工作者,即便不懂代码,也可以通过可视化界面,上传几个文件,授权访问特定的数据源,然后用自然语言告诉AI自己的需求。在短短几分钟内,一个相当复杂的AI代理(Agent)就能被构建和部署。
这几乎是一场针对Agent构建的“零代码革命”。它的意义在于,将创造复杂软件工具的能力,从少数专业的开发者手中,解放给了数以亿计的、拥有不同领域知识的普通人。
这对下一波创业者和开发者意味着什么?
创意的实现速度呈指数级提升,奥特曼坦言,“我甚至觉得自己的创意都跟不上它的速度了。” 过去需要数周甚至数月开发的功能,现在可能在一天之内就能完成原型测试。
试错成本大幅下降,创业者可以快速尝试更多的想法,更快地找到市场真正需要的好点子。
软件编写的总量将爆炸式增长,大量个性化、垂直化的需求将得到满足,长尾市场的潜力将被彻底激活。
2.2 “零人公司”的诞生倒计时
当构建AI代理的门槛降至冰点,一个更为激进的商业形态便浮出水面——“零人公司”。
奥特曼透露,OpenAI内部曾有一个小小的赌局,预测第一家“单人十亿美元公司”何时出现。而现在,这个预测已经升级为第一家“零人公司”何时诞生。他给出的预期是“几年内”。
“零人公司”并非指完全没有人类参与,而是指公司的核心运营、产品交付、客户服务等关键流程,都由AI代理自主完成,人类创始人可能只负责设定最初的战略目标和进行高阶监督。
我们可以想象一个由多个AI代理协作构成的虚拟公司:
市场分析Agent,持续监控行业动态和用户反馈。
产品开发Agent,根据市场需求自动编写和迭代代码。
营销推广Agent,在社交媒体上生成内容,精准投放广告。
客户服务Agent,7x24小时回答用户问题,处理售后。
奥特曼认为,虽然目前Agent Builder还无法达到完全自主的水平,但“可以看到从这里到那里的路径”。他以 Codex(代码生成工具)为例,指出其已经能完成“整天任务”,距离连续工作一周的目标也“不会太远”。
当然,要实现这一愿景,技术上仍有瓶颈需要突破。奥特曼明确指出了三大关键要素:
更智能的模型,具备更强的推理和规划能力。
更长的上下文,能够记忆和理解更复杂的任务流程。
更好的记忆能力,实现跨任务、长周期的学习和经验积累。
2.3 给创业者的建议 “让战术成为战略”
面对AI带来的巨大机会,许多创业者感到既兴奋又迷茫。在构建产品时,如何找到并维持独特的竞争优势?
奥特曼给出的建议非常务实,他引用了一句他很喜欢的商业名言:“让战术成为战略。”
他的意思是,不要一开始就试图设计一个完美无缺的宏大战略。相反,应该从做那些当下看起来有效、能解决实际问题的事情开始。在这个过程中,一些意想不到的、可以发展为长期护城河的优势,往往会自然浮现。
他以ChatGPT自身的发展为例。最初团队启动ChatGPT时,并没有完全预料到什么会成为其最持久的优势。后来,记忆(memory)功能被证明是一个极其重要的竞争壁垒,它让用户与ChatGPT的交互变得更加个性化和连贯,从而极大地增强了用户粘性。而这一点,在项目初期并未被视为核心战略。
这个例子告诉我们,在AI时代,快速行动、持续迭代、并从用户真实的使用行为中发现价值,比闭门造车式的战略规划更为重要。AI改变了世界,但商业竞争的基本法则——如网络效应、品牌、用户数据等——并未改变。改变的是建立这些优势的战术和路径。
三、📊 GPT-6的路径、平台化与行业新基准
在访谈中,奥特曼也分享了关于OpenAI核心产品——GPT系列大模型的未来规划,以及对行业竞争格局的看法。他的坦诚和开放,展现了一家头部科技公司在激烈竞争中的自信与清醒。
3.1 ChatGPT的平台化雄心
奥特曼透露,ChatGPT的周活跃用户已达8亿,这使其不再仅仅是一个应用,而是一个潜力巨大的新分发平台。将应用(Apps)引入ChatGPT,是他很早就想做的事情。通过Apps SDK,开发者和创业者可以在ChatGPT之上构建自己的应用,直接触达海量用户。
这标志着ChatGPT正在从一个工具型产品,向一个生态型平台演进。未来,用户与AI的交互可能不再是简单的问答,而是通过自然语言调用各种应用来完成复杂任务。比如:
“帮我规划一次去东京的旅行,并预订机票和酒店。”(调用旅游应用)
“分析我上个季度的销售数据,并生成一份PPT报告。”(调用数据分析和办公应用)
“根据这张草图,帮我设计一个网站。”(调用设计和开发应用)
奥特曼也承认,这种新的分发机制还需要迭代和探索。用户是会通过应用名称来调用,还是希望ChatGPT智能推荐?这都需要在实践中学习。但无论如何,一个全新的AI原生应用生态正在形成。
3.2 GDPval基准与坦然的第二名
近期,一个名为 GDPval 的新基准测试引起了业界的广泛关注。它旨在衡量AI模型在主要知识工作岗位中,完成实际经济任务的表现。令人惊讶的是,在首轮公布的结果中,OpenAI的GPT-5(可能是指某个内部版本或GPT-4的升级版)排在第二,落后于竞争对手Anthropic的Claude Opus模型。
面对这个结果,奥特曼的态度非常坦然。他直言:“如果我们不愿意发布模型排名第二的结果,那就太糟了。”
他认为,建立持续进步的文化,关键就在于能够“愉快而直接地承认,在某些基准或评测上,别人比你做得更好”。他称赞Claude团队在理解企业用例和优化输出呈现方面做得非常出色,并表示自己因此受到激励,想要做得更好。
这个小插曲反映了AI行业竞争的几个新动向:
评测标准正在从学术基准转向实际应用价值,GDPval这类衡量经济任务表现的基准,将变得越来越重要。
行业竞争异常激烈,没有永远的王者,各家模型在不同维度上各有千秋。
开放和透明的心态,是推动整个行业前进的动力,承认对手的优势并从中学习,比固步自封更有价值。
3.3 GPT-6的策略方向
那么,GDPval的测试结果会影响下一代模型 GPT-6 的构建方式吗?
奥特曼的回答是,会影响部分后训练(post-training)的方式,但不会改变GPT-6的整体策略。
这意味着,OpenAI可能会在模型的微调和对齐阶段,更多地参考这类经济任务的表现,让模型在企业应用场景中输出更漂亮、更实用的结果。但是,GPT-6的核心研发目标——即追求更底层的通用智能——不会因此动摇。
这揭示了OpenAI在模型开发上的双轨思路:
核心策略,持续推动基础模型能力的边界,追求更强的通用推理、知识理解和创造能力。
应用策略,通过后训练、微调等手段,针对特定场景(如企业应用、代码生成)进行优化,提升产品的实际效用。
奥特曼还提到,AI在法律、财务建模等垂直领域的应用潜力巨大。随着技术成熟,如果这些领域的专用工具能达到Codex在编码领域的水平,那将是极其令人兴奋的。这暗示了未来GPT模型可能会以更垂直、更专业化的形态,赋能各行各业。
四、🔭 AGI的新航标 从“像人”到“超越人”
通用人工智能(AGI)一直是OpenAI的北极星。但在这次访谈中,奥特曼揭示了他对AGI判定标准的深刻演变。这个变化,标志着AI发展的目标,正从模仿人类智能,转向扩展人类知识的边界。
4.1 从经济价值到科学发现
过去,奥特曼对AGI的定义之一是“当AI在大多数经济价值最高的工作上超越人类时”。这是一个非常实用主义的定义,强调AI在现有社会经济体系中的替代能力。
但现在,他最关心的指标已经发生了变化。他惊喜地发现,一个新时代已经开启,那就是“当AI能够进行新颖发现,能够扩展人类知识总量的时候”。
他强调,这些成就目前还很小,他既不想夸大,也不想低估。但他提到,现在你可以在社交媒体上看到,不同学科的科学家们分享AI如何帮助他们做出小发现、提出新方法或解决某个悬而未决的问题。
这才是真正重要的事情。
这个转变意义非凡。它意味着AGI的价值,不再仅仅是作为一个更高效的“劳动力”,而是作为一个前所未有的“科学研究伙伴”。它不再是简单地学习和复制人类已有的知识,而是开始生成人类未知的新知识。
4.2 “图灵测试”之后的新常态
奥特曼用“图灵测试”来类比社会对AI进步的适应过程。
曾几何时,通过图灵测试被认为是AI遥不可及的圣杯。但当GPT-4轻松通过后,人类社会发生了什么?大家兴奋了两周,然后就开始抱怨它为什么不够快、为什么在某些问题上会犯错。
那项“AI永远的测试”就这么过去了,我们都迅速适应了。
奥特曼感觉,现在AI进行科学发现这件事,也会发生类似的情况。一开始我们会感到震惊和兴奋,但很快,我们会逐渐习惯AI作为科学发现的引擎之一。它将成为科研工作流中一个自然而然的组成部分。
这种“适应性”,恰恰体现了人类的伟大。我们总能将最前沿的科技,迅速内化为我们认知和工具体系的一部分,然后站在新的起点上,提出更高的要求。
所以,当被问及希望AI解决哪些科学突破时,奥特-曼的回答既宏大又朴素。当然,治愈疾病、发现新的物理规律会很棒。但即便是现在正在发生的、数学领域的一些小进展,也让他觉得意义重大。因为这标志着,一个由AI辅助、甚至由AI主导的知识大发现时代,已经拉开了序幕。
五、🎬 Sora的远征 从视频生成到商业共赢
在OpenAI的众多产品中,Sora无疑是近期最引人注目的明星。但奥特曼的分享告诉我们,Sora的意义远不止于一个强大的视频生成工具。它既是通往AGI的重要路径,也是OpenAI探索全新商业模式和处理技术伦理挑战的试验田。
5.1 Sora的终极目标 AGI的世界模型
当被问及Sora的目标是否是生成无法分辨真伪的AI视频时,奥特曼的回答直截了当:“目标是AGI。”
他解释说,高质量的视频生成对实现AGI至关重要。原因在于,为了生成逼真、符合物理规律的视频,模型必须在某种程度上理解和模拟真实世界。这个过程,实际上就是在构建一个“世界模型(World Model)”。
通过学习海量视频数据,Sora能够学到:
空间推理能力,理解物体之间的位置关系和三维结构。
物理常识,比如重力、惯性、流体动力学等。
因果关系,预测一个动作会带来什么样的后果。
这些能力,不仅对视频生成至关重要,更是通往更高级通用智能的基石。奥特曼甚至认为,这对于未来机器人领域的真正进展也同样重要。因此,Sora不仅仅是一个内容创作工具,它更是OpenAI在AGI道路上,探索物理世界理解能力的一块关键拼图。
5.2 “恶搞CEO”与社会适应的阵痛
强大的技术总会伴随着伦理和滥用的风险。Sora发布后,网络上迅速充满了恶搞奥特曼本人的视频。对此,他表现得相当从容。
他认为,提前发布这类技术并设定护栏,是一种主动引导社会适应的方式。因为他清楚地看到,这项技术终将普及。未来几个月或几年,一定会出现强大的开源模型,任何人都可以用它来生成任何人的影像。
与其被动等待,不如主动出击。OpenAI的策略是:
提前发布,让公众、媒体、政策制定者提前了解技术的潜力和风险。
设定护栏,在产品层面加入安全措施,比如内容审核、水印等。
共同进化,让社会和技术有时间相互适应,逐步建立起新的规范和信任机制。
他坦言,视频的冲击力比文本更强,适应过程会更难。但我们必须学会适应一个网络上充斥着大量AI生成内容的世界。提前让社会开始这场“免疫反应”,或许是降低长期风险的必要代价。
5.3 商业模式的多元探索
Sora的商业模式,是奥特曼正在积极思考的另一个问题。与ChatGPT清晰的订阅模式不同,视频内容的生成和消费场景更为复杂,因此商业模式也需要更加灵活和多元。
奥特曼透露了几个正在探索的方向,这为我们描绘了一幅AI内容产业与创作者共赢的蓝图。
奥特曼强调,现在对一个刚上线几天的产品下定论还为时过早。最终的商业模式,将取决于用户真实的使用行为。是私密分享为主,还是公开消费为主?这将决定Sora最终的产品形态和盈利方式。他乐观地估计,到今年年底或明年一季度,他们会对这个问题有更清晰的答案。
六、💬 交互的未来与产品的边界
在访谈的最后部分,奥特曼分享了他对未来人机交互形态的思考,并再次明确了ChatGPT的产品定位。这不仅关乎用户体验,更反映了OpenAI在构建未来AI生态时的战略取舍。
6.1 语音不是终点 多模态才是未来
很多人认为,语音将是AI交互的最终形式。但奥特曼对此提出了不同看法。他明确表示:“我不认为语音是交互的最终形式。”
他举例说,在公共交通工具上,对着设备说话会非常烦人。语音虽然在很多场景下很自然,但它并非万能。未来的交互,应该是多模态、多场景、无缝切换的。
有时是语音,比如在开车或做饭时。
有时是打字,比如在需要精确输入或保持安静的场合。
有时是图像或视频,通过视觉信息进行更直观的沟通。
他理想中的计算机体验是,你只需用最自然的方式下达指令,它就能准确完成你想要的操作,然后几乎不打扰你。这背后,是对环境、用户意图的深度理解,以及在不同模态间自由切换的能力。
他还暗示,OpenAI正在探索一种“全新的设备”,但这需要耐心,短期内不会公布。这表明,OpenAI的野心可能不止于软件,而是希望通过软硬件的深度结合,来定义下一代计算平台。
6.2 不做“美国微信” 专注“AI超级助手”
随着ChatGPT集成的功能越来越多,有人猜测它是否想成为像微信那样的“万能App”。对此,奥特曼给出了坚决的否定。
“不,有很多原因让我认为这种方式在美国市场行不通。”
他强调,OpenAI想做的是一个“真正优秀的AI超级助手”。这个定位非常清晰。他认为,将社交、娱乐等功能强行塞进ChatGPT,会显得很奇怪,并与用户对它的核心认知产生冲突。
ChatGPT在用户心智中,是一个高度个人化、值得信赖的效率工具和知识伙伴。如果把它变成一个嘈杂的社交平台,会稀释其核心价值。
这也是为什么Sora会作为一个独立的App推出。虽然功能上可以互通,但在品牌和用户心智上保持区隔,是维持产品专注度和用户信任的关键。
这个决策,体现了OpenAI在产品战略上的克制与清醒。在平台化的大趋势下,他们选择了一条更聚焦的路径,即做深、做透“AI助手”这一核心价值,而不是盲目地进行功能扩张。
七、🌪️ 直面“Workslop” 组织的适应与进化
最后,访谈还触及了一个非常现实的问题,即AI在提高效率的同时,也可能带来新的麻烦。斯坦福大学的一项研究提出了一个新词——“Workslop”,用来描述那些由AI生成的、表面完美但实际上需要大量人工返工的低质量内容。
研究显示,41%的办公室职员遇到过同事产生的“Workslop”,平均每次清理需要花费近2小时。这无疑给AI的应用前景蒙上了一层阴影。
奥特曼的回应,再次展现了他系统性的思考方式。
首先,他指出,这不是AI独有的现象。人类组织本身就充满了各种“Workslop”,比如毫无意义的会议、冗长含混的邮件。低效是组织固有的熵增,不必期望AI能完全豁免。
其次,他相信经济会自我调整。那些能够高效利用AI工具、建立起高质量输出流程的公司和个人,最终会比那些用AI制造垃圾、拖慢组织效率的人,更具竞争力。这是一种市场的自然选择。
最后,他承认存在学习曲线。就像使用任何新工具一样,人们需要时间去学习什么时候该用AI,什么时候不该用,以及如何更好地与AI协作。OpenAI也在尝试制作更多的教育内容,帮助用户更好地将AI融入工作流。
总而言之,奥特曼认为“Workslop”是一个阶段性的、可以通过组织适应和市场选择来解决的问题,而不是AI技术本身的根本性缺陷。
结论
回到最初的那个问题,“能被ChatGPT消灭的工作不是真正的工作”。通过这次深度访谈的层层剖析,我们或许可以更完整地理解奥特曼这句话的内涵。
它并非一句轻率的断言,而是一个基于对技术、历史和人性深刻洞察的未来预言。它告诉我们,AI带来的不是工作的终结,而是工作形态的又一次伟大迁徙。被“消灭”的,是那些重复、乏味、缺乏创造性的“任务集合体”。而真正属于人类的、以创造力、同理心和战略远见为核心的“工作”,将在AI的赋能下,迎来前所未有的绽放。
从Agent Builder的“零代码革命”,到“零人公司”的商业畅想;从AGI的新航标,到Sora的商业探索,奥特曼为我们描绘的,是一个AI与人类深度协作、共同扩展知识与创造力边界的未来。
在这个未来里,与其焦虑于自己的岗位是否会被取代,不如反躬自问,我们所从事的工作中,有多少是真正不可替代的“人类价值”所在?如何利用AI这一强大的新杠杆,去撬动更大的创造可能?
这,或许才是奥特曼真正想让我们思考的问题。
📢💻 【省心锐评】
奥特曼的棋局不在于替代人力,而在于重构价值链。与其焦虑饭碗,不如思考如何成为AI时代的价值定义者。
评论