大模型“狂飙”之下国产算力缺口如何补齐-军工资源网—

大模型“狂飙”之下国产算力缺口如何补齐

军工资源网 2026年03月20日

2026年以来，国产人工智能（AI）大模型持续迭代，多家知名企业更新甚至“周更”自研大模型，以满足时代发展需求。然而，在大模型竞相发力的背后，算力“荒”逐渐显现。随着热度激增，不少知名国产大模型在发布后发现响应卡顿，用户在使用过程中出现AI回复延迟、回答偏离等问题。一位行业人士向记者透露，相比去年，今年大模型竞速式更新对底层算力需求更为突出。算力一旦没跟上，前端使用就容易产生问题。

“在人工智能+制造浪潮下，算力是核心底座，但行业缺少的从来不是单纯的算力硬件，而是能真正适配产业需求、好用又可控的解决方案。”在太初元碁硬件系统研发实验室，太初（无锡）电子科技有限公司（以下简称“太初元碁”）首席产品官、市场副总裁洪源，向记者点出了当下国产AI算力产业发展的痛点。他认为，破解这一行业痛点，需要国内算力企业在技术自主创新与软硬件协同上持续攻坚。

持续优化异构众核架构

2026年1月7日，工业和信息化部联合多部门印发《“人工智能+制造”专项行动实施意见》（以下简称《意见》），提出加快突破训练芯片、异构算力等关键技术，推动人工智能产业高质量发展。2月6日，工业和信息化部发布《关于开展国家算力互联互通节点建设工作的通知》，提出构建“1+M+N”国家算力互联互通节点体系，推动算力资源标准化互联与高效流动，为国产算力产业发展按下加速键。

据中国信息通信研究院预测，到2030年全球算力规模将突破16ZFlops（16泽浮点运算每秒），智能算力占比将从2023年的63%大幅度提升至90%以上。而异构算力正是支撑智能算力提升的关键力量。《意见》明确将异构算力列为关键技术突破方向，要求到2027年实现安全可靠供给。

“异构众核架构不是简单的算力拼凑，而是把标量、向量、矩阵3类算力单元有机融合在单芯片内。”洪源解释称，“这种融合不是静态的，而是动态的，能够根据应用特征灵活调配资源，在软硬件协同下释放极致性能。”

目前，太初元碁正致力于推动高性能计算与人工智能的融合创新。太初元碁硬件系统研发负责人吴志勇介绍说，太初元碁异构众核架构围绕计算、访存、通信三大环节展开系统优化。比如，为应对推理任务的高延迟敏感特性，访存通路径做了专项优化，减少数据搬运开销。此外，融合高速网络与跨数据中心传输的高性能通信机制，保障了大规模分布式计算的数据协同效率。

稳定运行同样关键。通过结合高效液冷散热与动态调频调压技术，太初AI芯片可在不同负载下智能调节性能及功耗，实现更高的系统能效与更好的运行稳定性。吴志勇说，这一特性已落地SuperPod 128等高密液冷智算单元，并支持万卡规模的系统互联。

2025年年初，在DeepSeek-R1系列模型开源后，太初元碁团队依托该架构，仅用2小时就完成了在T100加速卡上的高效适配，快速上线多款大模型服务。2026年春节期间，太初元碁还完成多款国产主流开源大模型的深度适配工作，累计适配国内超40款AI大模型，实现即发即适配，上线即可用。

软硬协同筑根基

要实现技术优势真正落地、实现产业价值，离不开全栈能力的系统性整合。

“一手筑牢硬件根基，一手打磨软件实力。”洪源认为，真正能支撑全行业、全场景的通用AI能力，必须建立在软硬一体的全栈技术体系之上，这也是国产算力走向各领域、服务各场景的关键。

通过自研编译器、跨层转置通信库、适配PyTorch2.7.1的TecoPyTorch框架等一系列工具，太初元碁搭建起从底层指令到智能编程的完整工具链。洪源补充道，“AlphaFold3的复现与商业化落地，让AI能力延伸至生物医药、气象等科研领域。”

不仅如此，全栈协同理念也在更广阔的生态展开实践。以国家超级计算无锡中心为例，基于新一代国产神威超算系统，该中心构建了覆盖“芯片—软件—应用”的全栈国产化高性能计算体系，在生物医药、工业仿真、城市治理等领域孵化出多项创新应用。

从实验室到真实场景，全栈能力正在悄然渗透。政务大模型一体机落地上海宝山“一网通办”，教科研实训一体机走进高校，惠企政策一体机助力政企解读。行业人士表示，软硬协同从来不是“硬件+软件”简单叠加，而是两者在架构层面深度融合、在应用层面彼此成就，最终让AI渗透到每一个行业、每一个场景，推动产业智能化升级。

从“能用”迈向“好用”

当前市面上，算力总量看似充足，实则真正高端、好用的算力极为稀缺。

要解决上述问题，需从产品破局。太初元碁生产的全国产化AI加速卡全程自主可控、稳定量产，筑牢基础算力底座；元碁液冷AI工作站适配国产CPU，开箱即用；而入选“十四五硬核成果”的SuperPod128高密液冷智算集群，支持万卡部署，精准填补高端算力空白。

有了产品之后，如何将零散的硬件部署成高效可靠的系统，才是更大考验。太初元碁高密液冷智算集群方案已助力盐城超级计算中心、河南空港智算中心等地项目规模化落地，还将在今年落地汉腾科技“五个万卡集群”。这摆脱了简单的“算力堆砌”，在提升算力密度的同时大幅度优化了算力能效。

“汉腾科技2026年开工的承德、石家庄、兴化3个项目，全是以国产万卡为起点。”南京汉腾蓝域数据科技有限公司（以下简称“汉腾科技”）董事长王皓霆介绍说，该企业计划2026-2027年做到10万卡规模，覆盖国内核心算力办公需求。

“打造算力产业园，核心是整合芯片端、算力端、应用端企业。”王皓霆总结道，推动相关企业联动研发，前置参与产业设计而非中后期介入，才能让芯片、算力更贴合地域化产业需求，这正是国产算力产业融合的关键。他认为，算力市场必将迎来爆发式增长与深刻变革：一方面是各行各业的产业端算力需求猛增，另一方面产业本身也在升级，国产算力的发展周期已经到来。更重要的是，产业需求重点正在转移，从前看重原材料、硬件设备，如今更渴求算力与算法的深度融合。

挑战亦不容忽视。“内存等有技术壁垒的关键核心材料价格涨幅显著，供应链难以快速跟进市场需求；国产大模型此前多适配英伟达设备，2026年全面向国产算力设备靠拢，成为产业端核心转型难题；芯片供应链仍处于初级阶段，高端芯片流片依赖台积电。但值得期待的是，国产光刻机正朝着这一方向奋力突破。”王皓霆补充道。

大模型“狂飙”之下 国产算力缺口如何补齐

网站已关闭

大模型“狂飙”之下国产算力缺口如何补齐