主持人:

国产模型和国产芯片,真在一起跑了吗?

琴姐:

是的,已经跑起来了。 DeepSeek 的新版本,华为昇腾、寒武纪都做到 Day-0 级别适配。寒武纪甚至上线了 FP8+Int4 的混合量化,适配智谱GLM-4.,这是业界首次在国产芯片上投产该方案,实现‘国产大模型 + 国产算力’闭环。

——————————————————————————————————————————————————————————————

主持人:

昇腾 910B,到底强不强?

琴姐:

很强。910B 用的是达芬奇架构,矩阵运算效率高。FP16 算力实测大约 256 TFLOPS,功耗 310W。部分测试里能效比被评估比 A100 高约 25%。但也要说清:不是所有场景都全面碾压 A100,强项和弱项很分明。

——————————————————————————————————————————————————————————————

主持人:

那寒武纪、壁仞这些后续还跟得上吗?

琴姐:

寒武纪在跟。他们下一代微架构,就是冲大模型训练、视觉生成场景去的。而且跟 DeepSeek 的适配速度非常快。壁仞也在布局,但公开的性能细节没昇腾、寒武纪那么透明。整体看,国产算力在加速追赶,但梯度差异还在。