主持人:
国产模型和国产芯片,真在一起跑了吗?
琴姐:
是的,已经跑起来了。 DeepSeek 的新版本,华为昇腾、寒武纪都做到 Day-0 级别适配。寒武纪甚至上线了 FP8+Int4 的混合量化,适配智谱GLM-4.,这是业界首次在国产芯片上投产该方案,实现‘国产大模型 + 国产算力’闭环。
——————————————————————————————————————————————————————————————
主持人:
昇腾 910B,到底强不强?
琴姐:
很强。910B 用的是达芬奇架构,矩阵运算效率高。FP16 算力实测大约 256 TFLOPS,功耗 310W。部分测试里能效比被评估比 A100 高约 25%。但也要说清:不是所有场景都全面碾压 A100,强项和弱项很分明。
——————————————————————————————————————————————————————————————
主持人:
那寒武纪、壁仞这些后续还跟得上吗?
琴姐:
寒武纪在跟。他们下一代微架构,就是冲大模型训练、视觉生成场景去的。而且跟 DeepSeek 的适配速度非常快。壁仞也在布局,但公开的性能细节没昇腾、寒武纪那么透明。整体看,国产算力在加速追赶,但梯度差异还在。