来源: 未知 时间:2026-04-26 18:51 作者:丁浚航 浏览: ->手机浏览此文章
大陆AI新创公司深度求索(DeepSeek)V4预览版本近日上线并开源,首度采用华为AI晶片,分为Pro与Flash两版本。央视旗下新媒体《玉渊谭天》26日指,该版本距上次更新约5个月,在全球大模型快速迭代背景下,其「静默」一度被视为落后,但此次与华为升腾晶片体系深度适配,显示软硬体协同研发生态正逐步形成。
文章写道,DeepSeek新版本距V3.2已近5个月,在海外模型平均约91天迭代一版的节奏下,其更新节奏引发讨论。期间外界对V4传闻不断,但DeepSeek未作回应,使资讯多来自外媒与匿名消息。沉默的DeepSeek,让人很不习惯,因其2025年初的横空出世、用更少的算力实现更优的性能、打破美西方营造的「算力焦虑」。
文章提到,2月26日,事情迎来转折。路透援引知情人士称,DeepSeek在V4发布前未向辉达(NVIDIA)及AMD提供早期访问权限,而是让华为提前数周进行软体适配优化,并形容此举「breaking from standard industry practice」,即打破行业惯例,并指这种做法在过往中外大模型开发中均较为少见。
文章指出,「此次DeepSeek与华为升腾国产晶片体系深度适配,并不令人意外。」DeepSeek早于V3.1版本即采用UE8M0 FP8 Scale参数精度,面向大陆下代国产晶片设计。而软体主动适配硬体特性,本质上是在为国产晶片「量体裁衣」,因软体需对算子、通信与并行策略进行调整,以适配不同晶片架构。
文章进一步称,大陆国家发展改革委去年12月曾表示,大陆国产晶片在多场景加速适配,「超节点」等技术推动算力提升。
北京邮电大学人机互动与认知工程实验室主任刘伟表示,模型与晶片的结合是AI竞争的重要方向,未来的AI发展,不仅在于算法的好坏,同样也要看整个生态是否具有韧性。他并指出,辉达CUDA生态长期占据主导地位。
文章提到,在此背景下,大陆大模型与晶片体系面临兼容既有生态或重构软体栈的选择。大陆大模型要想实现真正的自主,就必须形成软硬体一体化的协同能力。
文章称,DeepSeek-V4在适配升腾晶片后实现高吞吐、低延迟推理部署,这是技术上的新探索,也是我们在软硬体协同领域的一种进步讯号,智谱GLM-5亦完成与7家大陆国产晶片平台的适配测试。在大模型训练中,也出现了「纯国产」的实践样本,部分企业已在大陆国产算力集群上完成模型训练。
大陆科技与战略风云学会副会长陈经分析,部分大模型已基于国产算力体系进行训练,显示软硬体协同生态正在形成。不过文章同时提到,当前晶片制程与单卡性能仍有限,需依赖系统设计与集群架构补足。

本文转自:TNT时报
中央纪委国家监委网站26日公布全国查处违反中央八项规定精神问题情况月报数据。通报显示,2020年9月,全国共查处违反中央八项规定精神问题11929起,处理17314人(包括63名地厅级干部...
血色山谷 濒危动物上餐桌——一起命案牵出的买卖野生动物大案 缴获的野生动物被放归森林 2019年,四川凉山普格县警方破获系列重特大破坏野生动物资源案,100余人涉案,网络遍及全...
一个多月十余家公司疑似跑路,部分杠杆率超十倍 长租公寓连环“爆雷”深陷信用危机 赵乃育 绘 刚刚过去的国庆假期,成都市双流区的张晓朋一边忙着寻找出租房,一边密切关注着维...
本站讯 吉林省德惠市的朝阳乡,地处第二松花江畔,风景秀丽,...
去看看>>
国有企业的健康发展离不开严格的合规管理与有效的外部监督。...
去看看>>
近日,吉林省律师协会会长、党委副书记田大原被多名职工实名...
去看看>>
北京平谷法院许友刚万里红涉枉法裁判等四宗罪,被指对抗巡视...
去看看>>
本人李世儒(身份证号14020219590918951X)是一个有着41年党龄、23年军...
去看看>>
核心提示:江苏盐城市民张继祥因亭湖法院违法保全措施,致名...
去看看>>
近日,中控技术实控人褚健的私人生活及过往行为引发了广泛关...
去看看>>
本站讯 近日,吉林省公主岭市一雨污分流工程引发的债务纠纷持...
去看看>>
本站讯 众所周知,公章在法律上的作用主要是确认文件的真实性...
去看看>>
吉林律协会长田大原涉虚假诉讼等四宗罪,离任审计造假被曝光...
去看看>>
吉林省市场监管厅王淑英陈宇等竟然沦为