← 返回首页
智谱唐杰深夜谈了下“长周期任务”|kimi|唐廷枢|唐杰|智谱|翻译_手机网易网 网易 网易号 0

智谱唐杰深夜谈了下“长周期任务”

美股研究社
美股研究社
2026-05-15 11:22 ·湖南
0
打开网易新闻 查看精彩图片

智谱股价暴涨之后,唐杰深夜在X上发了一条很长的思考。

这件事我建议大家不要只当成“创始人出来讲观点”,放在资本市场里看,它更像一次没有PPT的战略路演。

前一天,智谱股价暴涨36.9%,收在1150港元,创下历史新高。从1月8日116.20港元发行价算起,四个多月涨了900%。这时候创始人出来谈AI产业下一步,市场一定会听。

唐杰讲的核心词,叫Long-Horizon Tasks,长周期任务。

听起来有点学术,但翻译一下:AI不能只会回答问题了,它得开始替人把事办完。

过去两年,我们看大模型,基本都在看“智商”。谁回答更准,谁写代码更快,谁上下文更长,谁榜单分数更高。这个阶段,AI像一个聪明助理,你问一句,它答一句;你给一个任务,它做一小步。

但长周期任务不是这个逻辑,它要求AI在几个小时、几天,甚至更长时间里,持续推进一个复杂目标。它要自己拆任务,自己查资料,自己调用工具,自己试错,自己判断结果对不对。中间遇到问题,还要知道换路线,而不是卡在那里等人救。

这就不是“会聊天”的AI了,这是开始像一个“承包商”的AI。助手需要你告诉它每一步怎么干,承包商只需要你告诉它最后要什么结果。这个差别非常大。前者提高效率,后者改变组织成本。

这也是我觉得唐杰这条推文真正有价值的地方,它不是在讲一个新概念,而是在告诉市场:AI行业的估值锚可能要变了。

以前模型公司讲故事,讲的是参数、榜单、API调用、模型能力。现在市场已经有点听累了。因为模型越来越多,发布会越来越密,大家都在说自己更强,但投资者会问一句很现实的话:然后呢?能不能赚钱?能不能进企业流程?能不能替客户省钱?能不能形成订单?

长周期任务给了一个新的答案,如果一个模型真的能连续工作8小时,稳定执行上千步操作,不需要人工盯着,它冲击的就不只是程序员效率,而是整个执行层。

程序员、数据分析师、法务助理、投研助理、运营执行、客服质检,这些岗位的共同点是什么?不是每个人都在做顶级创造,很多工作都是把任务推进到结果。

查资料,整理文件,读代码,跑测试,改报告,复盘数据,验证方案,跟进流程。

过去这些事情需要一层一层人来做。以后可能变成:人给目标,AI跑流程,人最后审核。

这才是真正让企业愿意付钱的地方,企业不一定愿意为“AI回答得很漂亮”付高价,但一定愿意为“AI帮我少招一组人、少花一半时间、少走一堆流程”付钱,这就是从工具订阅,走向执行替代。

唐杰举了一个很好的例子:漏洞挖掘。找漏洞不是简单写几行代码。你要读大量代码,理解系统架构,搭测试环境,构造攻击输入,验证漏洞有效性,最后还要写报告。这个过程没有标准答案,失败很多,路径很多,很吃经验。

如果AI能在这种高度不确定、对抗性强的任务里跑起来,那普通企业里的很多流程,其实更容易被覆盖。因为大部分企业任务没有黑客攻防那么复杂。很多只是流程长、资料多、系统散、人力贵。

这就是AI最可能先产生商业化穿透力的地方,所以智谱为什么这时候被市场重新定价?关键也在这里。

智谱以前的市场标签比较尴尬,它不像Kimi那样靠C端爆款产品出圈,也不像阿里、百度、腾讯那样有云、搜索、社交、广告、办公这些大入口。智谱更像一家技术底子很扎实的大模型公司,模型能力不错,开源生态也有,但资本市场要给它一个特别高的估值,需要一个更清楚的故事。

长周期任务就是这个故事,它给智谱提供了一个新的定位:不是单纯的国产大模型追赶者,而是企业执行系统的候选玩家。

如果只拼通用基座模型,中国公司很容易被放在“追赶OpenAI和Claude”的框架里。投资者会天然觉得你在后面追,估值也会被压一头。

但长周期任务不一样,它不是只看模型有多聪明,还看工程化能力、工具调用、企业场景、权限管理、私有化部署、行业适配、客户交付。这些事情,反而是中国AI公司可以拼速度、拼执行、拼场景密度的地方。

智谱GLM-5.1的数据也很会讲故事,按照材料里说的,GLM-5.1能持续独立作业8小时,单次任务稳定执行1200到1700步操作,不需要人工监控。在SWE-Bench Pro上达到58.4%,超过GPT-5.4的57.7%和Claude Opus 4.6的57.3%。

你说这是不是意味着智谱全面超过OpenAI和Anthropic?当然不能这么简单下结论,但资本市场不一定要你全面超过,它要的是边际变化。

只要在一个新方向上,大家还没彻底拉开差距,智谱就有机会重新讲故事。以前是你追我赶,现在是在一个新赛道上抢右侧确认。

长周期任务就是这种赛道,它现在还没有绝对王者。OpenAI在做,Anthropic在做,国内大模型公司也在做。谁先把它包装成企业可采购、可部署、可监管的产品,谁就可能拿到新一轮估值溢价。

这背后还有一个更大的变化:AI可能正在吞掉APP,唐杰提到LLM OS,我觉得这是这条推文里最激进、也最有想象力的部分。

过去几十年,我们用软件,都是打开一个APP,然后在它规定好的界面里点按钮。写邮件就开邮件软件,做表格就开Excel,做项目就开项目管理工具。用户要知道自己用什么工具,文件在哪,按钮在哪,流程怎么走。

但Agent时代的逻辑不一样,你不再说“打开哪个软件”,你只说“我要什么结果”,比如你说,帮我整理一下这个项目这周的进度,发给张三。系统自己去找文档、读聊天记录、调项目管理工具、写邮件、确认收件人、选择发送时间。你不需要管文件在哪,也不需要管用哪个软件。

这就是从APP时代,走向任务时代,如果这个趋势成立,软件行业会被重新洗牌。过去谁掌握入口,谁掌握用户时间。未来谁掌握任务入口,谁掌握企业流程。办公软件、协同平台、云厂商、开发工具、行业软件、大模型公司,都会开始抢这个位置。

智谱的机会,是用长周期任务切进这个入口,但风险也非常大。

因为AI一旦开始长时间自主执行,它就不再只是说错一句话那么简单。它可能删文件,发错邮件,改错代码,调用错接口,误判业务风险。回答错了可以重新问,执行错了可能直接造成损失。

这也是为什么企业不会轻易把核心流程交给AI。

企业要的不只是强模型,还要权限系统、审计系统、回滚机制、风控机制。AI每一步做了什么,为什么这么做,出了问题怎么追责,都要讲清楚。

否则,越强越危险,这会成为长周期Agent最大的估值折扣。

资本市场会喜欢“AI替代执行层”的故事,因为它对应利润弹性、人力成本下降、效率提升。但资本市场也会担心安全事故、监管压力和责任边界。一旦出现大的失控案例,整个板块都会被杀估值。

所以唐杰这条路,最难的不是把模型做强,而是把模型变成企业敢用的系统。

智谱如果能做到这一点,估值逻辑就不一样了。

它不再只是卖API,不只是卖私有化模型,也不只是给企业做解决方案。它可以往更高一层走,变成企业任务执行系统的基础设施。

那时候,智谱讲的就不是“国产大模型”,而是“AI执行层”。

这个故事比单纯模型故事更值钱。

因为模型层很卷,价格会被打下来,推理成本也会不断下降。企业真正愿意付溢价的,是结果,是可靠性,是和业务流程绑定之后的迁移成本。

谁能把AI嵌进企业核心流程,谁就有订单能见度。谁能让企业少花钱、多办事,谁就有利润弹性。谁能在安全和监管上让客户放心,谁就能拿到长期估值。

当然,现在还不能直接说智谱已经跑出来了。

股价四个月涨900%,这里面肯定有情绪,也有资金博弈。市场正在给国产AI重新定价,但一部分预期已经打进去了。接下来真正考验智谱的,不是唐杰的观点够不够漂亮,而是三件事能不能兑现。

第一,GLM-5.1的长周期能力能不能在真实企业场景里稳定跑。

实验室里跑8小时,和企业系统里跑8小时,不是一个难度。真实环境有脏数据、旧接口、权限限制、突发错误、模糊需求。模型能不能扛住,才是关键。

第二,智谱能不能把长周期任务打包成产品。

企业不会自己从零搭Agent系统。它需要工具箱,需要模板,需要行业方案,需要安全机制。智谱要卖的不能只是“模型能力”,而是可直接部署的任务系统。

第三,客户愿不愿意为结果交付付高价。

AI公司最怕只有热度,没有付费;只有试点,没有规模化。长周期任务听起来很有价值,但最后要变成收入、毛利和现金流,才会真正支撑市值。

所以我的判断是,唐杰这条深夜推文,对中国AI产业的意义很大,但它不是终点,是一个新坐标。

它告诉我们,AI竞争正在从“谁更会聊天”,进入“谁更能办事”。

以前模型像知识型员工,负责回答问题。以后模型像执行型团队,负责把事做完。这个变化一旦成立,中国AI产业的机会就不只是追赶海外模型,而是用工程化、场景化、行业化,去抢企业执行层的重构红利。

这条线很大,也很危险。

兑现了,就是资产重估。
兑现不了,就是概念退潮。

智谱现在站在一个很关键的位置上。它不是最大的大厂,也不是最热的C端应用,但它抓住了一个很可能改变AI定价逻辑的词:长周期任务。

资本市场最喜欢的不是热闹,是真正的估值切换。

唐杰这条推文最大的价值,就是把智谱从“模型能力竞争”里往外拽了一步,推到“结果交付竞争”这张桌子上。

接下来要看的,就是智谱能不能把这句话变成订单,把订单变成收入,把收入变成市场愿意持续定价的长期逻辑。

如果能,中国AI的下一轮主线,可能就不再是大模型排行榜。

而是:谁先让AI替企业把事情干完。

特别声明:本文为网易自媒体平台“网易号”作者上传并发布,仅代表该作者观点。网易仅提供信息发布平台。
打开网易新闻体验更佳

热搜

热门跟贴

相关推荐

回到顶部 回到首页