中国人工智慧(AI)模型DeepSeek-V4日前发布。中国媒体指出,其最大意义是利用国产算力进行推理,带动中国本土AI产业链发展,多家相关公司股价都出现大涨。
中国AI新创公司DeepSeek在24日正式发布最新版本模型,按大小分为两个版本:DeepSeek-v4-Pro和deepSeek-v4-Flash。
据公开报导,DeepSeek V4原生搭配华为升腾晶片,在推理上完全根据国产算力完成。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现中国国内与开源领域的领先。
当天,中国AI产业链集体大涨,摩尔线程、壁仞科技、天数智芯、海光信息等均实现上涨。晶圆代工的中芯国际H股单日涨幅达10.01%,华虹半导体H股单日涨幅更是超过15%。
每日经济新闻25日评论指出,DeepSeek V4真正的价值不在模型本身,而在于其背后的供应链逻辑;它并非用模型能力让世界惊艳,而是让中国的AI用户能低成本调用Token(词元)。DeepSeek这一次迈出的,是利用国产算力进行推理、刺激中国AI产业链的重要一步。
新京报25日也评论,中国最先进的开源大模型在推理阶段实现了国产替代,这才是DeepSeek V4发布背后更值得关注的讯号。
文章说,这种替代产生了双向价值。一方面,国产大模型的大规模采用,为国产算力晶片提供了真实的压力测试场景和持续的需求拉动;算力供给能力的提升,又反过来为模型的规模化部署和降价普及创造了条件。
DeepSeek在发布中明确表示,受限于高端算力,V4-Pro的服务吞吐十分有限,预计下半年升腾950超节点批量上市后,V4-Pro的价格会大幅下调。
这篇评论说,DeepSeek V4与国际顶尖闭源模型之间的能力仍有差距。国产算力在训练侧的大规模应用,目前也仍属起步,从个案到行业惯例,还有相当距离。
本文转自:TNT时报
