0
栏目|《态度》
作者|丁广胜
做芯片,所有人都想成为英伟达,但国家超算背景的太初元碁有截然不同的解法。
“算力只是入场券,真正的竞争是成本和模型适配能力。”在太初元碁CEO杨晋喆看来,AI芯片的比拼,早已不再停留在参数和峰值算力层面,而是进入到围绕总拥有成本(TCO)与系统效率的深水区。
“我们不做中国的英伟达,要做世界的太初。”他说。这意味着,这家公司并不满足于“国产替代”的位置,而是试图打通从底层硬件到上层应用、从算力到Token的完整链路,在全球范围内争夺下一代AI计算体系的话语权。
杨晋喆说,如果只做GPU,创业公司本质上只能做英伟达生态的追随者。单一架构的路径不仅难以形成差异化,还会被锁定在既有的软件生态之中,难以掌握真正的技术主动权。
所以,太初元碁从成立之初就选择了一条更“重”的路径,不做单一芯片,而是构建“芯片+集群+软件”的一体化计算体系,押注异构众核架构与系统级能力。
杨晋喆告诉《态度》栏目,未来的竞争,不是单颗芯片的性能之争,而是集群效率、系统协同与模型适配速度的综合较量。“芯片的赛道虽然不是一个挣快钱的赛道,但AI 未来的核心市场在中国,相比英伟达我们会具备更大发展空间。”
在访谈中,他还回应了“自主可控”的标签,杨晋喆坦言,自主可控只是一个小的目标,内部已经三年没提过这样的概念,自主可控最终仍然要回归到创新。
以下为《态度》栏目与对话杨晋喆实录(经调整):
网易科技:在你看来,未来AI芯片竞争的核心是算力、成本,还是模型适配能力?
杨晋喆:算力只是一张入场券,进入竞技场后真正的比拼和较量,是成本跟模型适配的能力。算力是一个客观的要求,是基础门槛,只要达到基本阈值即可满足需求,够使就行。真正关键的,还是成本控制和模型适配能力。企业采购芯片,看的是整体 TCO 总拥有成本。一方面是你提供算力的实际成本,另一方面是把模型迁移、适配过来要投入多少人力、时间和额外开销,这两块才是决定客户选不选你的核心。
谁能把这两点做好,谁就有真正的竞争力。
网易科技:你们选择“芯片+集群+软件一体化”,而不是专注做GPU,这背后的核心判断是什么?
杨晋喆:太初在公司创立初期就已经形成核心判断,之所以不聚焦做单一GPU,主要是基于两方面的关键认知:
首先是基于我们对单一架构的芯片从技术维度上的理解,我们认为单一架构的芯片缺乏灵活性,尤其是对将其放置到一个长期发展的维度来看,是比较难去支撑时代发展的需求的。随着智能体时代的到来,算力需求呈爆发式增长态势,而目前单颗芯片的性能已经制约AI发展,未来一定会需要更高性能的计算系统来支撑大规模甚至超大规模的算力互联。AI不再是单一场景应用,而是要赋能千行百业、支撑各类行业场景,而满足复杂多样的场景需求,必须依靠更通用的架构来支撑。但现阶段GPU的通用性实际正在持续下降,大量AI模块被硬化到芯片中,硬件固化就会直接削弱通用性,难以适配多元化、差异化的行业应用,这也是我们不聚焦做单一GPU的核心原因。
二是从创业公司的发展路径来看,一旦确定专注GPU的架构,其实作为一个创业公司没有其他的选择,只能兼容英伟达CUDA生态。CUDA采用软硬件协同的保护机制,前70%功能通过逆向工程比较容易实现,但剩余20%-30%的核心功能会极难破解,而且英伟达本身自己也还在不断迭代升级。在这种路线下,创业类公司做国产GPU会很难形成差异化竞争优势。换言之,创业型公司要搭建一套能代替CUDA的生态体系,这是非常困难的,并且复刻并不是一个很好的差异化商业选择。
网易科技:太初未来更希望成为类似NVIDIA这样的芯片公司,还是类似AWS的算力服务平台?
杨晋喆:我们有一个宏大的愿景:不做中国的英伟达,而要成为世界的“太初”。在成立之初,太初就是朝着聚焦高性能计算的智能计算系统服务提供商的定位来设计,AI芯片是太初技术转化的一个载体,但并不是唯一载体和形式。
我们跟英伟达这类芯片公司会有一些类似,不同的是太初服务于云端、大型集群等场景,集群化相关产品也会纳入服务体系中。在此基础上,太初也会推出类似 AWS 的算力服务平台类产品形态,部分能力自主建设,部分会与合作伙伴联合打造,通过生态共建的方式共同提供算力服务。而芯片与硬件系统,则是我们对外提供各类服务的基础底座。
AI 时代到来后,行业已从单纯输出底层标准计算芯片,转向从算力到Token的输出模式。在我看来,AI 未来的核心市场在中国,我国拥有着庞大的应用市场,相比英伟达我们会具备更大发展空间。同时,太初不准备走单纯“替代”这条路,不是只做芯片,只服务本土市场,而是要打通从上层应用到token再到底层硬件的一个结合,目标是成为全球算力服务提供商,掌握软硬件定义权,实现真正自主可控。
网易科技:太初的核心竞争力是什么?
杨晋喆:太初服务的核心逻辑就是面向于未来全球市场或者叫做算力市场,也是刚刚提到的要做世界的“太初”。我们看到,目前包括英伟达等等这样的企业,其实都在往异构的方向去转变,太初成立之初就聚焦异构众核,我们并不会面临之前做的一些技术需要转向异构这样的“历史包袱”。因此,我们做的最极致,也效率最高。当我们的产品投入到了一定的程度之后,在完全开放的市场里面,是会有我们自己的独到的商业化优势。
网易科技:太初元碁成立五年了,感受如何?经历过哪些挑战甚至质疑。
杨晋喆:坚持一种技术路线并长期走下来,这是最大的一个挑战。芯片的赛道不是一个挣快钱的赛道,在面对产品市场、资本市场可能会存在的变化,我们能够始终坚守去沿着我们的这种技术路线去持续地探索坚持下去,然后做我们认为计算领域或者是未来算力领域正确的这种产品形态的打磨,让更多的人去认可我们,这个肯定是挑战很大的。
早期,异构众核的这个技术路线在国内的资本市场会遇到一些“质疑”,但是随着全球技术的发展和我们一直以来的坚持,现在大家开始非常认可异构的理念,也逐渐认可太初在这一套技术体系下在做的事情。
网易科技:如果三年后太初没有成功,你认为最可能出问题的环节在哪?
杨晋喆:对于“成功”我们不会用一些具体的事件或者标准来衡量,可能有的观点会认为上市了是成功,但从企业长期发展路径来看,这只是企业发展会经历的一环。而像我们提到的愿景,也是一个时间周期非常长的事情,短期内太初会做并且应该做的,是继续坚持我们的技术路线来打磨更多产品,服务市场对于算力的需求。
在这个基础上,我想提另一个点:关于自主可控。我认为自主可控只是一个小的目标,如果你做的事情真的是创新的,那么它一定是自主可控的。自主可控是我们自己在内部已经有三年都没有提过的这样的一个概念,它是我们最基础的一个,就是能达到的一个点,而国内其实在现在的阶段,一部分是需要自主可控,但是自主可控的最终落脚点目前也仍然要回归到创新。
芯片的话它做出来只是第一步,它上面的软件的事情,其实软件生态的这个东西也非常的关键。那么你做了一颗芯片,然后软件这边的事情掌握在别人的手里面,你也没有办法称之为自主可控。所以只有说你的芯片从硬件到软件的决定权都在你的手里面,然后这个时候才能称之为自主可控,我认为太初从开始做这个公司一直坚守的就是这样的一个理念。
我们做异构众核,毫不夸张地说,是全球比较早就开始聚焦这个领域的团队。刚刚提到太初最大的困难是什么,太初最难的事情是在于没有作业可以去抄,面临的风险就是创新的风险。没有人,你抄不了别的人的作业,但是它的收益就是在于你一切的东西都可以去可控,当你真正的完成了你的商业化落地了之后,面向未来市场无论市场怎么样变化,你都能够最快速地去进行响应。
网易科技:太初的异构众核架构,与传统GPU相比,优势在哪?
杨晋喆:异构融合已经成为计算体系架构的明确演进方向,英伟达、AMD等国际大厂及 Tenstorrent 等头部芯片创业公司,都在持续迭代异构技术与产品布局。而太初元碁的异构众核技术路线采用芯片级原生异构设计,将通用控制、加速计算与数据处理等不同类型核心深度集成于单芯片内,这种架构不仅具备更高的技术上限,还同时兼具 GPU 的高性能计算能力与 CPU 的编程通用性,为国产高端算力芯片突破现有技术格局、追赶国际领先水平,提供了一条自主可控且独具优势的发展路径。
这样的优势会主要体现在:
首先是架构上更全面:我们在一颗芯片上就集成了通用计算核心、加速计算核心和数据处理核心等不同异构处理单元,而且支持统一内存寻址,计算精度能从FP4覆盖到FP64,还能通过高速片间互联技术,能支持基于内存语义的百卡规模Scale Up互联。
其次是分工特别明确:我们让每类核心都各司其职,这样就避免了传统GPU中不同类型任务会争抢计算资源的结构性问题,可以把计算资源的高性能算力充分释放出来,不浪费算力。
更灵活高效:除了支持传统的Host-Device模式外,异构众核可以在自主计算模式下作为独立主机工作,这样就能让一部分负载在芯片上的通用计算核心上运行,不用在Host和Device之间频繁地搬数据、通信,能给负载提供更高的性能。
在应用场景的应对上,这些优势也会转换成为“更能打、更划算、更流畅”的硬核能力:
科学计算场景更能打:比如在超智融合这种科学计算场景中,单颗芯片就能同时满足AI模型的低精度需求和HPC负载的高精度要求;而且在HPC和AI交替执行的场景里,相比于传统CPU-GPU系统架构,可以在通用核心和加速核心之间提供更低延迟、更高带宽和更高的性能表现。
大模型推理更划算:在大模型推理场景中,相比传统的CPU-GPU系统架构,异构众核架构可将部分软件栈运行在通用计算核心之上,进而降低Host侧CPU和内存在整体系统中的占比,为应用提供更高的性价比。
Agentic场景更流畅:在Agentic LLM场景里,面对coding、chat、文献分析等场景中超长上下文带来的性能挑战,相比传统CPU-GPU系统架构,异构众核架构可以优化CPU-GPU之间的数据通信性能和访存效率,降低端到端系统延迟,让用户体验更好。
网易科技:你们已经适配的多个大模型中,有多少进入了真实生产环境?
杨晋喆:今年春节以来,我们能看到,国产AI大模型的发展势头越发猛烈,甚至一度呈现“周更”趋势。截至目前,太初依托自研AI加速卡与SDAA软件栈的深度协同,完成了超过40个AI大模型的即发即适配,上线即可用,完整覆盖了智谱GLM、阿里千问Qwen3.5、DeepSeek、Minimax等国内主流大模型厂商的新品,将行业普遍数周甚至数月的适配周期压缩至天级,打破了模型迭代与国产化落地的时间壁垒。
我们的客户对于国产AI大模型都有不同的需求,刚刚提到的40多个大模型适配后,很多也都走入了真实的落地场景中。在教科研领域,在智慧政务领域,在工业算力基础设施领域都已经落地。比如,基于对通义千问与DeepSeek大模型的深度适配,我们携手上海宝山行政服务中心打造并落地了“AI+”智慧政务便民应用“宝你HUI AI小宝”,为办事群众提供便捷高效的全流程智能化政务服务,累计服务用户数万名。
网易科技:客户选择太初,是会出于性能优势,还是政策与供应链安全的考虑?
杨晋喆:综合性的考虑。在性能方面,客户的核心考量往往并非单点指标,而是集群化部署后,能否切实解决实际业务问题的综合性能,这是我们的核心优势之一。在商业化落地过程中,国内市场为本土企业提供了关键的培育环境,国家出台的很多政策利好,也给市场提振信心来选择国产。
太初采用开源开放生态,区别于部分闭源方案可能带来的绑定问题,能让客户拥有更强的自主优化与定制空间,使用更放心、更灵活,这也是客户倾向选择我们的重要原因。
网易科技:你有关注龙虾吗,自己和团队对它有什么见解?
杨晋喆:我们肯定是高度关注的。说得直接一点,作为一家AI芯片公司,如果连人工智能都用不好,那肯定是要掉队的。
所以我们现在在整个芯片研发流程里,都在积极用 AI 做辅助,希望借助人工智能包括龙虾,帮我们降成本、提效率。AI 会大幅缩短芯片的迭代周期、降低研发门槛,这是大势所趋,我们必须提前做好准备,用最快的速度推进芯片研发迭代。
另一方面,对企业来说,未来的趋势一定是人力投入越来越少、AI占比越来越高。谁能更早、更好地用好AI,谁就能在研发上领先一步。所以对我们而言,AI 既是挑战也是机遇,同时也让我们很有危机感。但它带来的好处也很明显:随着 AI、智能体等技术越来越成熟,以前我们主要服务大型企业,未来 AI 可以覆盖更多中小企业,整个市场的打通和增长速度都会明显加快。
此外,在自身应用龙虾的同时,我们也在紧跟行业需求,配套提供对应服务。3月18日,太初元碁发布了OpenClaw全栈国产化适配方案,同步推出了开箱即用的太初龙虾一体机(TecoClaw)。大家可以去了解一下。
00:02