智谱唐杰深夜谈了下“长周期任务”|kimi|唐廷枢|唐杰|智谱|翻译_手机网易网网易网易号

智谱唐杰深夜谈了下“长周期任务”

美股研究社

2026-05-15 11:22 ·湖南

打开网易新闻查看精彩图片

智谱股价暴涨之后，唐杰深夜在X上发了一条很长的思考。

这件事我建议大家不要只当成“创始人出来讲观点”，放在资本市场里看，它更像一次没有PPT的战略路演。

前一天，智谱股价暴涨36.9%，收在1150港元，创下历史新高。从1月8日116.20港元发行价算起，四个多月涨了900%。这时候创始人出来谈AI产业下一步，市场一定会听。

唐杰讲的核心词，叫Long-Horizon Tasks，长周期任务。

听起来有点学术，但翻译一下：AI不能只会回答问题了，它得开始替人把事办完。

过去两年，我们看大模型，基本都在看“智商”。谁回答更准，谁写代码更快，谁上下文更长，谁榜单分数更高。这个阶段，AI像一个聪明助理，你问一句，它答一句；你给一个任务，它做一小步。

但长周期任务不是这个逻辑，它要求AI在几个小时、几天，甚至更长时间里，持续推进一个复杂目标。它要自己拆任务，自己查资料，自己调用工具，自己试错，自己判断结果对不对。中间遇到问题，还要知道换路线，而不是卡在那里等人救。

这就不是“会聊天”的AI了，这是开始像一个“承包商”的AI。助手需要你告诉它每一步怎么干，承包商只需要你告诉它最后要什么结果。这个差别非常大。前者提高效率，后者改变组织成本。

这也是我觉得唐杰这条推文真正有价值的地方，它不是在讲一个新概念，而是在告诉市场：AI行业的估值锚可能要变了。

以前模型公司讲故事，讲的是参数、榜单、API调用、模型能力。现在市场已经有点听累了。因为模型越来越多，发布会越来越密，大家都在说自己更强，但投资者会问一句很现实的话：然后呢？能不能赚钱？能不能进企业流程？能不能替客户省钱？能不能形成订单？

长周期任务给了一个新的答案，如果一个模型真的能连续工作8小时，稳定执行上千步操作，不需要人工盯着，它冲击的就不只是程序员效率，而是整个执行层。

程序员、数据分析师、法务助理、投研助理、运营执行、客服质检，这些岗位的共同点是什么？不是每个人都在做顶级创造，很多工作都是把任务推进到结果。

查资料，整理文件，读代码，跑测试，改报告，复盘数据，验证方案，跟进流程。

过去这些事情需要一层一层人来做。以后可能变成：人给目标，AI跑流程，人最后审核。

这才是真正让企业愿意付钱的地方，企业不一定愿意为“AI回答得很漂亮”付高价，但一定愿意为“AI帮我少招一组人、少花一半时间、少走一堆流程”付钱，这就是从工具订阅，走向执行替代。

唐杰举了一个很好的例子：漏洞挖掘。找漏洞不是简单写几行代码。你要读大量代码，理解系统架构，搭测试环境，构造攻击输入，验证漏洞有效性，最后还要写报告。这个过程没有标准答案，失败很多，路径很多，很吃经验。

如果AI能在这种高度不确定、对抗性强的任务里跑起来，那普通企业里的很多流程，其实更容易被覆盖。因为大部分企业任务没有黑客攻防那么复杂。很多只是流程长、资料多、系统散、人力贵。

这就是AI最可能先产生商业化穿透力的地方，所以智谱为什么这时候被市场重新定价？关键也在这里。

智谱以前的市场标签比较尴尬，它不像Kimi那样靠C端爆款产品出圈，也不像阿里、百度、腾讯那样有云、搜索、社交、广告、办公这些大入口。智谱更像一家技术底子很扎实的大模型公司，模型能力不错，开源生态也有，但资本市场要给它一个特别高的估值，需要一个更清楚的故事。

长周期任务就是这个故事，它给智谱提供了一个新的定位：不是单纯的国产大模型追赶者，而是企业执行系统的候选玩家。

如果只拼通用基座模型，中国公司很容易被放在“追赶OpenAI和Claude”的框架里。投资者会天然觉得你在后面追，估值也会被压一头。

但长周期任务不一样，它不是只看模型有多聪明，还看工程化能力、工具调用、企业场景、权限管理、私有化部署、行业适配、客户交付。这些事情，反而是中国AI公司可以拼速度、拼执行、拼场景密度的地方。

智谱GLM-5.1的数据也很会讲故事，按照材料里说的，GLM-5.1能持续独立作业8小时，单次任务稳定执行1200到1700步操作，不需要人工监控。在SWE-Bench Pro上达到58.4%，超过GPT-5.4的57.7%和Claude Opus 4.6的57.3%。

你说这是不是意味着智谱全面超过OpenAI和Anthropic？当然不能这么简单下结论，但资本市场不一定要你全面超过，它要的是边际变化。

只要在一个新方向上，大家还没彻底拉开差距，智谱就有机会重新讲故事。以前是你追我赶，现在是在一个新赛道上抢右侧确认。

长周期任务就是这种赛道，它现在还没有绝对王者。OpenAI在做，Anthropic在做，国内大模型公司也在做。谁先把它包装成企业可采购、可部署、可监管的产品，谁就可能拿到新一轮估值溢价。

这背后还有一个更大的变化：AI可能正在吞掉APP，唐杰提到LLM OS，我觉得这是这条推文里最激进、也最有想象力的部分。

过去几十年，我们用软件，都是打开一个APP，然后在它规定好的界面里点按钮。写邮件就开邮件软件，做表格就开Excel，做项目就开项目管理工具。用户要知道自己用什么工具，文件在哪，按钮在哪，流程怎么走。

但Agent时代的逻辑不一样，你不再说“打开哪个软件”，你只说“我要什么结果”，比如你说，帮我整理一下这个项目这周的进度，发给张三。系统自己去找文档、读聊天记录、调项目管理工具、写邮件、确认收件人、选择发送时间。你不需要管文件在哪，也不需要管用哪个软件。

这就是从APP时代，走向任务时代，如果这个趋势成立，软件行业会被重新洗牌。过去谁掌握入口，谁掌握用户时间。未来谁掌握任务入口，谁掌握企业流程。办公软件、协同平台、云厂商、开发工具、行业软件、大模型公司，都会开始抢这个位置。

智谱的机会，是用长周期任务切进这个入口，但风险也非常大。

因为AI一旦开始长时间自主执行，它就不再只是说错一句话那么简单。它可能删文件，发错邮件，改错代码，调用错接口，误判业务风险。回答错了可以重新问，执行错了可能直接造成损失。

这也是为什么企业不会轻易把核心流程交给AI。

企业要的不只是强模型，还要权限系统、审计系统、回滚机制、风控机制。AI每一步做了什么，为什么这么做，出了问题怎么追责，都要讲清楚。

否则，越强越危险，这会成为长周期Agent最大的估值折扣。

资本市场会喜欢“AI替代执行层”的故事，因为它对应利润弹性、人力成本下降、效率提升。但资本市场也会担心安全事故、监管压力和责任边界。一旦出现大的失控案例，整个板块都会被杀估值。

所以唐杰这条路，最难的不是把模型做强，而是把模型变成企业敢用的系统。

智谱如果能做到这一点，估值逻辑就不一样了。

它不再只是卖API，不只是卖私有化模型，也不只是给企业做解决方案。它可以往更高一层走，变成企业任务执行系统的基础设施。

那时候，智谱讲的就不是“国产大模型”，而是“AI执行层”。

这个故事比单纯模型故事更值钱。

因为模型层很卷，价格会被打下来，推理成本也会不断下降。企业真正愿意付溢价的，是结果，是可靠性，是和业务流程绑定之后的迁移成本。

谁能把AI嵌进企业核心流程，谁就有订单能见度。谁能让企业少花钱、多办事，谁就有利润弹性。谁能在安全和监管上让客户放心，谁就能拿到长期估值。

当然，现在还不能直接说智谱已经跑出来了。

股价四个月涨900%，这里面肯定有情绪，也有资金博弈。市场正在给国产AI重新定价，但一部分预期已经打进去了。接下来真正考验智谱的，不是唐杰的观点够不够漂亮，而是三件事能不能兑现。

第一，GLM-5.1的长周期能力能不能在真实企业场景里稳定跑。

实验室里跑8小时，和企业系统里跑8小时，不是一个难度。真实环境有脏数据、旧接口、权限限制、突发错误、模糊需求。模型能不能扛住，才是关键。

第二，智谱能不能把长周期任务打包成产品。

企业不会自己从零搭Agent系统。它需要工具箱，需要模板，需要行业方案，需要安全机制。智谱要卖的不能只是“模型能力”，而是可直接部署的任务系统。

第三，客户愿不愿意为结果交付付高价。

AI公司最怕只有热度，没有付费；只有试点，没有规模化。长周期任务听起来很有价值，但最后要变成收入、毛利和现金流，才会真正支撑市值。

所以我的判断是，唐杰这条深夜推文，对中国AI产业的意义很大，但它不是终点，是一个新坐标。

它告诉我们，AI竞争正在从“谁更会聊天”，进入“谁更能办事”。

以前模型像知识型员工，负责回答问题。以后模型像执行型团队，负责把事做完。这个变化一旦成立，中国AI产业的机会就不只是追赶海外模型，而是用工程化、场景化、行业化，去抢企业执行层的重构红利。

这条线很大，也很危险。

兑现了，就是资产重估。
兑现不了，就是概念退潮。

智谱现在站在一个很关键的位置上。它不是最大的大厂，也不是最热的C端应用，但它抓住了一个很可能改变AI定价逻辑的词：长周期任务。

资本市场最喜欢的不是热闹，是真正的估值切换。

唐杰这条推文最大的价值，就是把智谱从“模型能力竞争”里往外拽了一步，推到“结果交付竞争”这张桌子上。

接下来要看的，就是智谱能不能把这句话变成订单，把订单变成收入，把收入变成市场愿意持续定价的长期逻辑。

如果能，中国AI的下一轮主线，可能就不再是大模型排行榜。

而是：谁先让AI替企业把事情干完。

特别声明：本文为网易自媒体平台“网易号”作者上传并发布，仅代表该作者观点。网易仅提供信息发布平台。

打开网易新闻体验更佳

智谱唐杰深夜谈了下“长周期任务”

热搜

热门跟贴

相关推荐

智谱唐杰深夜谈了下“长周期任务”

热搜

热门跟贴

相关推荐

唐杰深夜发文，AI从工具到劳动力只差这一步

我把日程表交给AI管了一周，结果有点离谱

小唐老挝建厨房，小付哥想走了！唐爸担心木工和电工没适合人手！

任正非吃惊：华为当年抛弃的一群人掌控全球AI命脉

E45 孟岩对话李继刚：人何以自处

队长：6翻了，装都不带装的

做老大，下命令一定要准确

执行任务状况百出，回去铁定被大队长骂，这锅谁来背啊

卧底任务一旦暴露就在劫难逃了

小唐老挝建房，材料费上涨幅度很大，唐爸说先把庭院地皮做好再说

宁波国资委押注 电机企业菲仕技术再闯IPO

富时A50期指连续夜盘收涨0.22%，报15675点

港股IPO：广东华成电力能源递表港交所

外国萌娃给父亲当翻译却没有工资，爸爸大呼付不起，瞬间逗笑全场

马斯克出席完晚宴后离开会场，与美女翻译边走边聊！

两女子坐电梯，按亮所有楼层后离开

这个翻译也是绝了，是故意的还是故意的？

张雪机车53号车手德比斯在捷克站自由练习赛中以1分34秒389的成绩获得第1名

谁翻译一下他说了啥

因为电影的中文译名，我们错过了多少好电影

宁波国资委押注电机企业菲仕技术再闯IPO