← 返回首页
从一人公司到无人公司!智谱AI创始人唐杰:2026年突破焦点是长时程Agent|agent|kimi|人工智能|唐廷枢|唐杰|无人公司|时程|智能体|智谱ai_手机网易网 网易 网易号 0

从一人公司到无人公司!智谱AI创始人唐杰:2026年突破焦点是长时程Agent

新浪财经
新浪财经
2026-05-16 00:30 ·河北 ·优质财经领域创作者
0

来源:市场资讯

(来源:图灵人工智能)

您想知道的人工智能干货,第一时间送达

打开网易新闻 查看精彩图片
编辑 | 玉澄
打开网易新闻 查看精彩图片
编辑 | 玉澄

“今年最有可能出现突破的领域,将是长时程任务。”

“建立在长时程能力基础之上,自主 Agent 系统(AAS)必然会成为下一个前沿方向。”

“最困难、但也最有前景的道路,是‘自我进化’。”

“从完成长周期任务到实现完全自主运行,每一个行业,包括安全、金融、法律、电商,都将被重塑。”

智谱 AI 的灵魂人物、创始人兼首席科学家唐杰教授,近期在 X 上发了一篇帖子,对 AI 领域的发展趋势做出了系统且前瞻性的预判,让我们一窥 AI 的未来走向。

打开网易新闻 查看精彩图片

他在帖子中一口气抛出了 5 个核心观点:

第一,2026年大语言模型(LLM)的主要技术突破,再也不是单纯的“推理能力”,而是要转向长时程任务(Long-Horizon Tasks)。

这可不是他一个人这么说。今年1月,红杉资本就曾发文喊话,“长时程 Agent 实际上是通用人工智能(AGI),2026年将是他们的一年。”LangChain CEO Harrison Chase 也曾明确提出 2026 年是"长时程 Agents 元年"。与唐杰教授的观点不谋而合。

与此同时,AI 各大厂商早就悄悄行动起来,用实际功能发布印证了这一趋势:OpenAI Codex 和Claude Code 推出的 /Goal 功能和 Computer Use 功能,都是支持 LLM 与Agent 环境进行长时间交互,搞定复杂任务;从 Kimi 推出 K2.6 模型时展示的"连续编码 12 小时" 案例来看,能发现月之暗面团队也正朝这一方向发力。

打开网易新闻 查看精彩图片

不过,也有网友补充道:长时程任务目前最大的难点在于评估环节,智能体执行任务的中间步骤在评审时绝不能遗漏,否则执行效果只能停留在表面。

打开网易新闻 查看精彩图片

第二,去年热议的“One Person Company(一人公司)”会进一步向“None Person Company(无人公司)”转变,全靠 AI 自己搞定!

有网友在帖子下提到,Sam Altman 曾透露 OpenAI 内部赌池,已经从“第一个一人独角兽”转向“第一个零人公司”。

打开网易新闻 查看精彩图片

而就在昨天,Cursor 创始人兼 CEO 在重磅演讲《AI Coding 的下一个纪元》中也明确表示,他们正在探索无人类介入的端到端全自动开发自主 Agent Team 模式。

此外,各大 AI 厂商的多 Agent 技术也正在为这一转变铺路:

今年2月,Claude Code发布 Agent Teams 和多智能体编排(Multi-Agent Orchestration)功能,支持一个 lead agent(相当于队长)协调多个 teammate agents(队员) 并行干活、共享任务列表、还能互相沟通,堪比一个高效的小团队。

3月,Codex 发布 Subagents 和 Symphony 编排功能,搞出项目经理加专家团队模式,允许一个 manager agent 协调多个 specialized subagents,在隔离沙箱中工作。

4月,Kimi K2.6 放大招,子Agent集群数量达到300个,并表明正在探索让 K2.6 当“总指挥官”,统筹所有 Agent 干活!

说白了,这些技术进展都在指向同一个目标:为了让 Agent 管理 Agent,无需人类插手,实现全自动化工作流。

第三,为了实现这两种转变,唐杰教授指出,记忆(Memory)、持续学习(Continual Learning)以及自我判断(Self-Judging)技术是目前需要攻克的三大核心技术难关。

先说记忆方面,阿里通义实验室的林俊旸今年 1 月在行业峰会上预测,未来一年,记忆技术有望发展到 "让人类感受到类似人与人之间的记忆理解能力" 的临界点,再也不用反复跟AI说同一件事了。

再看持续学习方面,OpenAI 联合创始人 Ilya Sutskever 去年 11 月在 Dwarkesh Podcast 播客上就说过,AI 正重新进入 "科研时代",核心就是赋予模型持续学习、自我纠正的能力。

Anthropic 新推出的 "梦境(Dreaming)" 功能正是这一方向的突破,它能让 AI Agent闲下来的时候自动回顾、复盘历史数据并进行自我优化,使任务完成率提升了 6 倍。

最后是自我判断方面,Anthropic 新推出的 "Outcomes" 功能:通过独立评分器评估智能体输出,在逼着 AI 反复优化自己,可以看出其正在这一方向上进行努力。

第四,AI 未来最有潜力、最让人期待的方向是:自我进化!自己升级、自己变强,不用人类干预!

这可不是空想,今天全网刷屏的消息:田渊栋从 Meta 离职后,直接创立了 Recursive_SI ,主攻的就是这个方向!而该公司的创始成员诸葛鸣晨,早在2023年就在 MetaGPT 论文和附录中,讨论了递归自改进(recursive self-improvement)方向。看来这波趋势早就有苗头了~

同时这也让小编想起,Meta 及其合作者在今年3月发布的论文《HyperAgents》,已经研究到让 Agent 自主修改“改进机制”的地步。而谷歌 DeepMind 顶尖 AI 研究员 Mostafa Dehghani 在 4 月份的播客访谈里更是强调,AI 中的更高循环(loop)是自改进。

并且他还提出了一个更深入的洞察:AI 自我提升的最大瓶颈并不在算力或模型能力,而在于“评估”。搞清楚 AI 到底提升了多少甚至成了一个哲学问题:如果你无法衡量它,你就无法改进它。

第五,对于通用人工智能(AGI),唐杰教授给出了自己的定义:全人类集体智慧的总和。他还很认同谷歌 DeepMind 创始人兼 CEO Demis Hassabis的观点:AGI 应该达到能够创造出像 "相对论" 那样深刻科学成果的水平。

在朝 AGI 演进的过程中,他认为会出现一种大语言模型操作系统(LLM OS),而运行在其上的应用程序(APP)将全部是 AI 原生(AI-native)的,甚至是根据用户需求个性化生成的。

有网友看完帖子直呼:大开眼界!数十年的技术和研发经验让他认为,LLM正在逐步接管操作系统内核和现实世界。

打开网易新闻 查看精彩图片

其实 LLM OS 概念最早是由 Andrej Karpathy 提出的,他认为 LLM 不仅仅是模型,更是未来计算机的核心内核。个人认为 OpenClaw 就有点像 LLM OS 的雏形了:AI Agent 现在已经像操作系统内核一样调度 API、处理文件流和管理持久化记忆,而 Skill 有点类似 APP 。

最后送个彩蛋!评论区有人追问唐杰教授:“什么时候会把旗舰模型升级到原生多模态?”,他透露:“几个月后”。大家可以期待一波了~

打开网易新闻 查看精彩图片

帖子中的全部观点原文如下,enjoy:

向长时程任务的转变

今年最有可能出现突破的领域,将是长时程任务。我们正在迈向这样一个阶段:大型语言模型(LLMs)通过与 Agent 环境交互,学会完成长期、复杂的任务。这或许才是 LLM 真正价值所在。

以网络安全为例:想象一个模型能够持续不断地寻找软件漏洞和安全缺陷。虽然听起来像是一个搜索过程,但实际上,这是模型在学习职业黑客的高层次直觉与方法论。

与人类不同,AI 可以 24 小时不间断运行而不会疲劳。它可能会以远高于人类的频率发现漏洞,并在 HackerOne 或 BugCrowd 这类平台上领取漏洞赏金。这听起来很有趣,但从本质上说,这是一次取代黑客职业的革命。如果连黑客都正在被“颠覆”,那普通程序员所受到的冲击就更可想而知了。

从“一人公司”到“无人公司

建立在长时程能力基础之上,自主 Agent 系统(AAS)必然会成为下一个前沿方向。

去年,我们还在讨论“一人公司”的崛起。我没想到,我们会如此迅速地迈向“无人公司”。这是一种颇具讽刺意味的转折,在这个新生态中,我们或许最终都会变成 NPC(非玩家角色)。

工程化实现“不可能”:记忆与学习

为了实现上述愿景,我们必须解决三个技术支柱:记忆、持续学习以及自我判断。

我曾经认为,这些能力需要巨大的范式转变以及多年的研究。然而,来自技术和应用两端的压力如此巨大,以至于我们正在看到这些能力通过巧妙的工程“技巧”逐渐实现:

记忆:超长上下文窗口(100 万 token 以上)与 RAG 技术已经显著弥补了差距。

持续学习:虽然真正意义上的持续学习依然困难,但模型发布周期正在不断缩短。全球模型正在按月更新,国内模型也正在快速追赶。如果明年我们能够实现按周更新,那么它在效果上基本上就是持续学习了。

自我判断:这是目前最难捉摸的能力,但像 Opus 4.7 这样的模型已经开始展现初步的自我纠错与判断能力。

自我进化的终局

最困难、但也最有前景的道路,是“自我进化”。当前这股浪潮异常猛烈。

我怀疑,像 Claude 这样的模型,可能已经达到了自我训练的基础能力:编写它们自己的代码、清洗它们自己的数据、生成合成数据,然后再基于这些数据进行训练。

这或许会“浪费”一些算力,但它节省了最宝贵的资源:人力与时间。在 LLM 时代,速度就是一切。快速迭代,正是拉开领先者与追随者认知差距的关键。传闻中 Claude 明年将拥有的“两百万芯片集群”,很可能正是为模型自主训练而准备的。

技术总结:

重新定义 AGI 与整个行业

如果这就是通往 AGI 的道路,那么 AGI 的定义应该是全人类集体智慧的总和,而不仅仅是某个个体的智能。它必须具备创造出像“相对论”这样深刻成果的能力,达到 Hassabis 所设定的标准。

在这个转型过程中,每一个 APP 都需要被重构为 AI-native。事实上,我们甚至可能会彻底超越 APP 这一概念。最大的挑战,将是操作系统本身的重构。

未来,你不会再看到传统桌面,而会看到一种 LLM OS,其中应用程序是“按需生成”的。这将挑战已有 80 年历史的冯·诺依曼架构,并代表整个计算机科学产业的一次彻底颠覆。

不可逆的浪潮

从完成长周期任务到实现完全自主运行,每一个行业,包括安全、金融、法律、电商,都将被重塑。最近很多朋友联系我,询问该如何推动企业转型,以跟上 AI 的步伐。但很少有人真正意识到,这个不可逆的进程其实已经开始了。当这场巨大的技术浪潮袭来时,我们不仅必须做好行动准备,也必须开始认真思考如何对其进行监管。

https://x.com/jietang/status/2054222017566855508

https://sequoiacap.com/article/2026-this-is-agi/

特别声明:本文为网易自媒体平台“网易号”作者上传并发布,仅代表该作者观点。网易仅提供信息发布平台。
打开网易新闻体验更佳

热搜

热门跟贴

相关推荐

回到顶部 回到首页