分享好友 最新资讯首页 最新资讯分类 切换频道
【硬件资讯】前路阴云笼罩……末代RDNA的AI之路崎岖难行,仍未能加入ROCm生态?
2025-09-07 21:16

AMD宣布,对ROCm软件栈进行了更新,推出了新的迭代版本ROCm 6.4。这一新版本里,AMD带来了多项底层改进,包括更新改进了ROCm的用户空间库和AMDKFD内核驱动程序之间的兼容性,使其更容易在更广泛的Linux内核上运行。可惜的是,这次仍然缺乏对RDNA 4架构GPU的支持。

图片

AMD还扩大了内部测试,以涵盖更多用户和内核版本的组合,这应该会减少高性能计算(HPC)和人工智能(AI)工作负载的集成问题。在框架方面,ROCm 6.4现在支持PyTorch 2.5/2.6开箱即用,开发人员无需从源代码开始构建,就可以使用最新的深度学习功能。Megatron‑LM集成增加了三个新的融合内核,包括Attention (QKV)、Layer Norm和ROPE,通过将多个操作合并到单个GPU通道中来加速训练。

视频解码也得到了提升,在rocDecode和rocPyDecode中都支持VP9。同时现在已正式支持Oracle Red Hat Enterprise Linux 9,Radeon PRO W7800 48GB工作站显卡可在ROCm下进行验证。AMD还在NPS4内存配置下启用了CPX模式,以满足MI Instinct系列加速器上的高级内存带宽需求。

AMD已宣布将于太平洋时间2025年6月12日上午9点30分举行“Advancing AI 2025”活动,将讨论AMD对AI的愿景,带来下一代Instinct系列GPU和AMD ROCm开放软件生态系统的进展,届时可以了解到更多详尽信息。

    

    还记得我们在RDNA 4家族两款显卡刚刚发布的时候说的话,两款显卡都是便宜管饱的大显存显卡,16G显存也刚刚好可以用于部分AI项目的部署,待未来支持ROCm之后,一定会大有作为。然后,截止到现在,到刚刚更新的ROCm 6.4版本RDNA 4仍未得到支持……

    AMD玩AI本就不易,如今官方支持也是迟迟未到,难道这末代RDNA真的会成为遗憾的一代?不过对于大部分游戏玩家来说,这倒是完全没有影响,或许真的会成为AI时代不随大流的游戏死忠?




AMD在今年3月初推出了新一代RDNA 4架构的Radeon RX 9070系列显卡,理论上下一批产品应该就是第二季度的Radeon RX 9060 XT,不过RX 9060 XT用的Navi 44 GPU是128bit显存位宽的,所以只能弄出8GB或者16GB显存的版本,这就让RX 9070和RX 9060 XT之间的性能落差会很大,因此有消息指出AMD可能会面向国内市场推出配备12GB显存的Radeon RX 9070 GRE显卡。

图片

根据benchlife报道,目前Radeon RX 9070 GRE 12GB在AIB合作伙伴的规划中,已经准备进入投产阶段,因此很快就会看到相关显卡在国内市场推出。

目前RX 9070 XT和RX 9070都是用256bit显存位宽和16GB GDDR6显存,而RX 9070 GRE从12GB的显存容量就能看出位宽会削至192bit,如果所用的显存速率依然是20Gbps的话,带宽会降低至480GB/s,降低了四分之一,除此之外流处理器数量也肯定会比RX 9070的3584个更少。

AMD会根据不同地区的市场情况制定不同的SKU,而国内市场是经常会出这类产品的,比如AMD没有在国内推出的RX 7600 XT转而推出了RX 6750 GRE系列,还有最近刚推出没多久的RX 7650 GRE,而RX 9070 GRE有不小可能会在国内取代RX 9060 XT 16GB的地位,说真的128bit的卡出16GB也不是很有必要。

另外AMD对GRE的定义已经从最初的“Golden Rabbit Edition”变成了“Great Radeon Edition”,所以这些GRE显卡也不一定是只面向国内市场的,此前Radeon RX 7900 GRE就在国外有销售。


    接下来,RDNA 4家族的新成员似乎也快来了。根据消息称,RX 9070系列家族还将迎来一款9070GRE,符合之前的传统用以丰富产品线。不过相比于两位哥哥,这哥9070GRE的显存就要小上不少了,显存带宽也会受到同等的影响,游戏表现上可能……另外,12G显存也有些达不到大部分AI项目端侧部署的门槛了,或许这会是更便宜的游戏之选。



AMD宣布,“Advancing AI 2025”活动将于太平洋时间2025年6月12日上午9点30分举行,届时官方的油管频道会有直播。AMD首席执行官苏姿丰博士以及整个AI生态系统的领导者,将讨论AMD对AI的愿景,带来下一代Instinct系列GPU和AMD ROCm开放软件生态系统的进展,并揭示面向超大规模企业、开发商、初创公司等的AI解决方案的详细信息。

图片

外界期待Instinct MI350系列首款产品,也就是Instinct MI355X。其引入了新一代的CDNA 4架构,采用了台积电(TSMC)的3nm工艺制造,搭配HBM3E,总容量进一步提升到288GB,对应带宽提高到8TB/s,TDP也上升到1000W,计划2025年下半年开始发货。按照AMD之前的说法,Instinct MI355X提供了2.3 Petaflops的FP16和4.6 Petaflops的FP8计算性能,相比前代产品的提升幅度约为77%。此外,新产品还将支持新的数据类型,包括FP4和FP6。

除此以外,AMD还可能会对下一代产品进行简要的介绍,比如Instinct MI400系列。

AMD已经在ROCm软件堆栈上耕耘多年,不断地进行更新,不过从目前情况来看,还远远不够。如果AMD想打破英伟达打造的CUDA生态系统,那么必须在软件上取得更大的突破。暂时还不清楚这次ROCm软件堆栈方面的情况,但是Advancing AI作为AMD在AI领域的重要活动,很大程度能看到其在AI领域的发展走向。


    最后,AMD还宣布了一项AI主题活动——Advancing AI 2025,该活动上AMD有望带来下一代Instinct系列专业加速卡。令人在意的是,本代的CDNA4之后,下一代AMD将把专业领域的CDNA与游戏领域的RDNA重新统合为UDNA,这次如果要介绍下一代Instinct系列专业加速卡的话,很可能会带来UDNA相关技术的信息,或许能提前窥见下一代AMD显卡的身影,大家可以关注一下!



欢迎加入

买电脑讨论群:386615430

电脑吧评测室官方一群:798545305



备注
    文章转载自网络(链接如上)。文章出现的任何图片,标志均属于其合法持有人;本文仅作传递信息之用。如有侵权可在本文内留言。
    引用文章内容与观点不代表电脑吧评测室观点。
最新文章
AWE观察 | 从“科技温饱”到AI盛宴 智慧家电能与消费者“双向奔赴”吗?
每经记者:陈鹏丽 彭斐 叶晓丹    每经编辑:陈俊杰每经记者 陈鹏丽 摄3月20日至23日,一年一度的中国家电盛会——中国家电
【硬件资讯】前路阴云笼罩……末代RDNA的AI之路崎岖难行,仍未能加入ROCm生态?
AMD宣布,对ROCm软件栈进行了更新,推出了新的迭代版本ROCm 6.4。这一新版本里,AMD带来了多项底层改进,包括更新改进了ROCm的用
字节跳动也加入AI耳机大战了?AI耳机风口来了?
最近几年,各种AI硬件可以说谁绝对的热门,就在近期大名鼎鼎的互联网大厂字节跳动也宣布加入,不过他们加入的是AI耳机大战,字节
@开封人!福利来啦!速看!
仕美茶业商行一、【黄菊花】客户端客户专享:买1斤,送半斤二、【墨玫】原价:3.5元/朵 客户端客户专享:1元/朵三、【惯蛋棋牌室
推出 AI 耳机,字节真正的野心是什么?
头图来源: Ola Friend10月10日上午,字节跳动豆包发布了一款硬件产品—— AI 智能体耳机 Ola Friend。该产品是一款开放式耳机,
打造具有世界影响力的上海文化品牌 | 社会科学报
培育数字赋能的核心文化产业及业态。在数字技术与文化产品融合的趋势下,应通过资本化运作,推动文化市场交易和流动,使文化价值
7月5日至8日,2025年德城区小学一年级新生入学信息采集
齐鲁网·闪电新闻7月4日讯 7月3日,德城区教体局发布2025年德城区小学一年级新生入学信息采集公告。为全面做好2025年德城区小学
北京两区,区长调整
据微信公众号“北京昌平”消息,12月19日,北京市昌平区第六届人大常委会第二十六次会议:决定副区长刘晓东为北京市昌平区人民政
2025年上海市为民办实事项目官宣,47件项目涵盖众多领域
人民网上海1月23日电 (马作鹏)为民办实事是上海民生工作的特色品牌。自1986年启动以来,上海市委、市政府每年集中力量办好一批民
【北京高质量发展】以静制动,探索超大城市停车治理路径
近年来,本市交通部门坚持顶层设计、综合施策,积极探索超大城市停车治理有效路径。按照以“居住区配建车位为主、路外公共停车场