DeepSeek砸开裂缝国产算力奔涌而出开启并行供应线

2025-02-08　来源：pengjian

DeepSeek成为国产算力企业在春节期间的一大亮点。2025年春节前，DeepSeek发布了大模型；春节期间，国内GPU企业和云计算厂商纷纷披露适配DeepSeek模型的进展，许多科技从业者因此度过了一个忙碌的假期。DeepSeek大模型基于英伟达的GPU进行训练，目前后者在全球大模型算力中占据主导地位。然而，DeepSeek也暗示了一种可能性：训练高性能的大模型可能不需要如此高的算力投入。

DeepSeek在科技圈引起轰动，为国产算力与国产大模型结合提供了机会。沐曦CTO杨建预测，到今年年底部分大模型的预训练可能会转向非英伟达的芯片，这一趋势将在明年更加明显。他认为中国市场将逐渐演变，最终形成英伟达和其他国产芯片并行的两条算力供应线。

DeepSeek砸开裂缝国产算力奔涌而出开启并行供应线

春节期间，多家国产芯片企业密集适配DeepSeek。例如，硅基流动公司宣布其自研推理加速引擎使华为云昇腾云服务部署的DeepSeek模型达到高端GPU的效果。Gitee AI则表示，在春节期间上线了四个较小尺寸的DeepSeek模型，这些模型均部署在沐曦曦云GPU上。摩尔线程也在其自主设计的夸娥GPU集群上完成了小尺寸DeepSeek模型的部署，并计划开放夸娥智算集群支持更多模型的分布式部署。优刻得基于壁仞科技的国产芯片开展包括R1在内的DeepSeek全系列模型适配工作。昆仑芯也完成了全版本模型适配，其中包括DeepSeek MoE 模型及其蒸馏的小模型。

DeepSeek砸开裂缝国产算力奔涌而出开启并行供应线

军事

DeepSeek砸开裂缝 国产算力奔涌而出 开启并行供应线

相关推荐：

DeepSeek砸开裂缝国产算力奔涌而出开启并行供应线