时隔一年AMD更新第2代RyzenThreadripper处理器,便油门一拜一脚踩尽32核心64执行绪,打破以往HEDT多核心性能。二代维持着Zen架构优化与12nm製程,不仅降低记忆体延迟,提升时脉更稳住温度,首波RyzenThreadripper2990WX与2950X,锁定工作站多核运算专业人士以及游戏发烧友,给予更多的核心、更强的性能、相同的价格,就这样摧下去RyzenThreadripper与Corei9的多核大战。 前事提要:关于第2代RyzenThreadripper处理器的开箱、4款产品的介绍,请参阅:油门全开AMDRyzenThreadripper2990WX、2950X开箱新信仰盒装旗舰之姿一文。 信仰开箱、处理器介绍,请点上方连结。 二代目优化Zen架构与12nm製程 第2代RyzenThreadripper处理器,同样採用经历一代优化后的Zen架构,可有效降低处理器L1、L2、L3快取延迟与记忆体延迟时间,并提升处理器时脉与支持JEDECDDR42933标準。 Zen优化让记忆体延迟更低。 经由GLOBALFOUNDRIES12LP(LeadingPerformace)製程的提升,让处理器时脉可提升200MHz,达到4。4GHz的高时脉,更在核心电压控制上降低了80120mV。 12LP製程再提升时脉与降低电压。 第2代RyzenThreadripper处理器藉由Zen优化与12nm製程的提升,让处理器整体性能比起上一代还要出色,不仅时脉提升、快取记忆体延迟降低,更有稳住功耗表现。 Zen的高弹性造就RyzenThreadripper的异曲同工之妙 AMD倾心打造的Zenx86架构,设计之初以增强指令集平行(InstructionLevelParallelism),强化快取、预测引擎与同步多执行绪(SimultaneousMultiThreading),藉此提升运算性能输出(Throughput)。 Zen架构有着高弹性的扩展能力,採用4核CoreComplex(CCX)模组设计,一颗裸晶Die里面封装2组CCX模组,意即一颗裸晶Die即有着44的核心数目。而核心、裸晶(Die)之间,则可通过InfinityFabric连接,让Zen架构有着高扩展性。 就从AMDRyzenThreadripper2950X说起,其处理器内部有着2颗可工作的裸晶(Die0与Die1),每一颗裸晶各自连接了2组DDR4通道、32条PCIe通道,而裸晶之间则透过InfinityFabric连接,有着50Gbps的传输性能。 2950X处理器架构图。 而32核心的AMDRyzenThreadripper2990WX,则是装好装满内部有着4颗可工作的裸晶(Die04),但为了相容X399晶片组,因此配置上Die0与Die2各自控制2组DDR4通道、32条PCIe通道,而Die1与Die3则做为单纯运算单元(不控制记忆体与IO)。 同样Die与Die之间都通过InfinityFabric相互连接,每个Die都可相互沟通传输资料,藉此降低延迟问题;4个Die之间的网状拓朴(meshtopology)连接可达到25Gbps的传输性能。 2990WX处理器架构图。 有趣的是,2950X在架构上支持单一的UMA(UniformMemoryAccess)或2组独立的NUMA(NonUniformMemoryAccess)的记忆体管理模式。UMA统一管理可获得最大频宽,但相对延迟较高;NUMA则可最小化延迟(核心走最近的DRAM控制器),这根据不同的应用程式可获得不同的性能提升,这项功能的切换则可在RyzenMaster软体中的MemoryAccessModes中进行控制。 但是2990WX则只支持NUMA(NonUniformMemoryAccess)的记忆体管理模式,主要原因在4组NUMA结构可让AMD打造32核心处理器,并且可相容TR4脚位与主机板,这也是AMD为了提供需要极高内容创作(ContentCreation)性能的市场使用。 SenseMI新功能PrecisionBoost2与XFR2 Ryzen处理器上所搭载的SenseMI技术,制订了许多功能可让处理器有着更好的电源控制、精準加速、更高的超频时脉、预测与预取等设计,而第2代RyzenThreadripper处理器,则具备了PrecisionBoost2与XFR2两项更新。 PrecisionBoost2延续着上一代25MHz步阶的超频方式,但比起上一代採用的4Core或AllCore超频机制,所造成的非线性时脉调整的问题,在这一代PrecisionBoost2中,可获得更线性、平滑的CPU时脉超频机制。 藉由PrecisionBoost2通过Opportunistic机制,根据温度、电流来提升CPU最高时脉,倘若CPU散热器有更好的温度压制能力,XFR2即可自动超频至更高的Turbo时脉,让玩家在主机板自动超频设定下,可获得更强悍的性能。 2950XPrecisionBoost2时脉变化曲线。 2990WXPrecisionBoost2时脉变化曲线。 2990WX若有更好的散热条件,可藉由XFR2获得更高的性能提升。 X399架构图4chDDR4,64PCIeGen3 第2代RyzenThreadripper处理器,可相容于既有X399主机板,玩家仅需透过BIOS更新即可支援。换句话说,2代RyzenThreadripper在IO规格上并无调整。 TRSoC也就是处理器本身提供了8组USB3。1Gen1、64条PCIeGen3通道与4组SATA;而X399晶片组则提供更多的USB3。0与USB2。0连接埠,而其中更有着2LanesPCIeGen3,可让主机板厂用作额外的4xSATA或2xSATAe来使用;而8Lanes的GPPPCIeGen2,则可用做网路、WAN、蓝牙或其他控制器之通道。 SOC、X399所提供的IO规格。 X399主机板架构图。 有关RyzenMaster的LegacyMode、GameMode与CreatorMode AMD一系列Ryzen处理器皆是可超频的设计,也因此玩家可透过AMDRyzenMaster软体来替处理器超频、调整电压,甚至关闭SMT或核心来进行更进阶的超频设定。而为了让用户快速操作,则提供了2种预设模式:CreatorMode与GameMode。 CreatorMode与GameMode两者最大差异在于LegacyCompatibilityMode,有鉴于一般游戏对多核心处理器的支援不佳,更遑论此次测试的16C、32C产品,因此GameMode会以关闭核心的方式,来提升该处理器在游戏时的性能 LegacyCompatibilityMode处理器 出厂预设 12CoreMode 14CoreModeRyzenThreadripper2950X 2Dies,16C32T,4CHDIMM 1Die,8C16T,2CHDIMM NARyzenThreadripper2990WX 4Dies,32C64T,4CHDIMM 2Die,16C32T,4CHDIMM 1Die,8C16T,2CHDIMM 举例来说:2990WX开启GameMode会从4Dies、32C64T、4CHDIMM降为12Core或14Core的模式,这可在RyzenMaster当中自行调整所需的核心数量;而2950X的GameMode则是从原本2Dies,16C32T,4CHDIMM降为1Die、8C16T、2CHDIMM的模式。 这功能对于32核心的2990WX有着相当明显的帮助,藉由关闭过多的核心,让游戏性能可再提升,而测试结果就留待游戏测试时统一为各位解答。 于RyzenMaster当中可开启LegacyCompatibilityMode关闭核心。 此外,针对2950X处理器所提供的MemoryAccessMode功能,可调整记忆体DistributedMode或LocalMode,也就是上述提到的UMA(UniformMemoryAccess)与NUMA(NonUniformMemoryAccess)的记忆体模式。 DistributedMode会分散用2颗Die上的记忆体通道,这设计可让需要16核心运算的程式,获得最好的运算性能,也因此CreatorMode会将记忆体设定为Distributed模式。 至于LocalMode则是将2颗Die的记忆体各自独立,也就是说每个Die都只用离自身最近的记忆体通道,如此一来更可降低记忆体延迟,也使得GameMode亦会将记忆体设定为Local模式。 实际测试,2950X在DistributedMode模式下,记忆体複製仅79084MBs且延迟较高91。5ns,而在切换为LocalMode之后,记忆体间的複製提升到88979MBs且延迟降低至67。6ns。 2950XDistributedMode记忆体性能。 2950XLocalMode记忆体性能。 性能测试RyzenThreadripper2990WX、2950X与i97980XE 究竟32核心的RyzenThreadripper2990WX与16核心的2950X处理器,比起对手i97980XE与i97900X在多核运算性能上能赢过多少?更比起自家一代1950X处理器,性能进步了多少?亦是本次测试的重点。 测试採用系统预设Auto的模式进行,唯一调整D。O。C。P。并载入记忆体3200MHz设定,并透过BIOS让散热器全速运转。 测试平台採用ASUSROGZENITHEXTREME主机板,以及G。SKILLFLAREXDDR48GB43200记忆体,作业系统则安装在SamsungNVMeSSD960PROM。2500GB上;作业系统则是最新Windows10Pro,并将游戏DVR关闭;搭配测试用的显示卡则是NVIDIAGTX1080TiFE;处理器散热器则是ENERMAXLIQTECHTR4240。 测试平台资讯。 (以下测试图表,以颜色代表处理器,橘色:2990WX、红色:2950X、澄色:1950X,而蓝色:i97980XE、深蓝色:i97900X。) CPUZ可检视RyzenThreadripper2990WX与2950X完整资讯,处理器代号PinnacleRidge,为12nm製程的处理器,2990WX为32核心64线程处理器,而2950X则是16核心32线程处理器;主机板使用ASUSROGZENITHEXTREME,X399晶片组;记忆体为四通道3200MHz。 CPUZRyzenThreadripper2990WX。 CPUZRyzenThreadripper2950X。 CPUmark99测试,单看处理器的单核心执行能力,单核心的IPC、时脉高即可获得相当高分。当然在单核性能上还是Intel较强,但就RyzenThreadripper来比较,最高分为2950X并赢过2990WX与一代1950X。 可见第2代RyzenThreadripper处理器,不仅多核性能增强,单核性能也有在进步。 CPUmark99,分数越高越好。 wPrime则用来衡量处理器多线程运算能力,透过计算平方根的方式来测量处理器性能,测试分为32M与1024M运算难度,就看谁的多核心运算能力较强,即可用最短的时间完成计算。 测试都以各处理器最大执行绪来进行测试。32M难度时,2990WX(64T)与i97980XE(36T)都遇到相同的问题,平行化运算过多,反而算了更多的时间,相对2950X(32T)计算32M只需2。9秒。 而1024M难度时,则由2990WX(64T)以32。8秒夺冠,而2950X(32T)亦有着相当好的表现。 wPrime,时间越短越好。 CINEBENCHR15由MAXON基于Cinema4D所开发,可用来评估电脑处理器的3D绘图性能。也是目前用来评比CPU运算性能常见的测试软体。 针对多核心CPU测试,大家都Auto测试下2990WX夺得5101分、2950X则有着3154分,分数都赢过比较的i97980XE与i97900X。但是单核心、OpenGL性能上还是Intel性能较好。 CINEBENCHR15,分数越高越好。 CoronaBenchmark则是相当容易操作的测试工具,主要是透过CPU运算光线追蹤的渲染图像,评分为计时以秒为单位。 从测试结果来看,2990WX花费42秒完成计算,而i97980XE则需要55秒的时间,至于2950X也只需68秒,但比较的i97900X则要更长的90秒。 CoronaBenchmark,时间越短越好。 VRayBenchmark可测试电脑的CPU对光线追蹤的渲染图像的运算速度,评分为计时以秒为单位。这测试结果与CoronaBenchmark相似,2990WX仅需27秒就完成工作,而i97980XE则需要38秒的时间,至于2950X也只需44秒,但i97900X则要近1分钟的时间。 VRayBenchmark,时间越短越好。 POVRay是一套免费的光线追蹤3D渲染工具,藉由多核心CPU的算力,来计算光影与3D影像的渲染。 2990WX藉由32C64T的多核心,有着9820PPS的计算速度,而2950X亦有着6308PPS的运算能力,比起i97980XE的6585PPS性能墙上许多。 POVRay,越高越好。 Blender是一款开源、免费的3D创作工具,支持完整的3D建模、动画、模拟、渲染等工作。本次测试,以AMDRyzenBlender专案来进行测试。 2990WX渲染Ryzen处理器影像仅需8。2秒,而2950X则需要13秒的时间,不过i97980XE则要12。7秒、i97900X更需要19。3秒的时间。 Blender,时间越短越好。 AIDA64记忆体与快取测试,此次测试都使用G。SKILLFLAREXDDR48GB43200记忆体。因此,记忆体表现上各都有着相当高的传输率,2990WX记忆体延迟仅65。3ns,而2950X预设使用DistributedMode的关係所以延迟较高。 AIDA64,记忆体性能越高越好,延迟越低越好。 WinRAR压缩测试,对于多核心要求不高,因此Intel在这测试上有着明显领先,且2990WX与2950X性能相近。 WinRAR,越高越好。 7Zip压缩测试与之相对,就可用到多核心的性能,2990WX虽然在压缩性能较低,但在解压缩有着185816MIPS的性能表现,至于2950X压缩有着73674MIPS的性能,解压缩141793MIPS。 7Zip,性能越高越好。 影音转档方面,测试使用X264X265FHDBenchmark进行,但由于这工具仅透过8核心来计算,因此性能表现不如预期。在X264编码下,2990WX的性能完全没有发挥出来,但时脉较高的2950X则有着63。3fps的性能,更赢过i97980XE。 但是在X265编码下,Intel本身有着指令支援,因此获得相当好的性能。未来,需要找实际的专案来做影音转档测试。 X264X265FHDBenchmark,性能越高越好。 针对测试平台对高效能IO装置的传输率表现,测试的是系统碟的SamsungSSD960PRONVMeM。2500GB。从测试结果可见,在循序、4K随机等测试上,AMD平台亦可完整发挥NVMeSSD所该有的性能。 CrystalDiskMark测试。 电脑整体性能测试,则以PCMark10来进行,可分别针对Essentials基本电脑工作,如App启动速度、视讯会议、网页浏览性能进行评分,而Productivity生产力测试,则以试算表与文书工作为测试项目,至于DigitalContentCreation影像内容创作上,则是以相片影片编辑和渲染与可视化进行测,最后Gaming测试则是分别计算电脑物理运算与绘图分数。 从总分Extended来看,2950X有着与i97980XE、i97900X相同的电脑性能;只不过,PCMark10则无法发挥2990WX的性能,主要原因在于核心(执行绪)过多、时脉较低的关係。 PCMark10测试,分数越高越好。 也因此,AMD考量到有程式不支援2990WX32C64T这么高核心数的平台,藉由RyzenMaster软体可启动LegacyCompatibilityMode,让2990WX关闭一半核心,变成16C32T在测试一遍,则同样获得8326分的评比。 可见是一般工作还不支持这么高的核心数。 PCMark10测试,分数越高越好。 同样的问题在3DMark中也遇到,预设下FireStrike测试2950X与i97980XE并驾齐驱,而其物理性能更赢过对手。 TimeSpy测试也是相同,2950X与Intel处理器性能相当;但是2990WX32C64T在这测试中完全得不到好处。 3DMark测试,越高越好。 同样再将2990WX的LegacyCompatibilityMode开启,在同样3DMark测试下,性能就正常许多。可见一般游戏真的让2990WX毫无用武之地。 3DMark测试,越高越好。 至于2950X也有着16C32T的多核心,倘若减半改为8C16T游戏性能会在提升吗?就从3DMark测试来看,反而是16C32T的2950X性能较好,由此可见游戏玩家的最高核心处理器非2950X莫属。 3DMark测试,越高越好。 游戏测试RyzenThreadripper2990WX、2950X与i97980XE 虽说RyzenThreadripper2990WX设计之初便不是为游戏玩家打造,也因此在全核心32Core测试下,平均fps低于正常表现。也因此AMD提供GameMode(LegacyCompatibilityMode)藉由关闭核心的方式,让2990WX能在游戏时有着正常水準的表现。 经测试,2990WX透过LegacyCompatibilityMode改为16核心时,可获得与2950X相近的游戏性能,而16核心与8核心相比,游戏平均fps差异则在10帧以内,因此游戏测试时2990WX採预设32核心测试,并补上16C、8C的成绩,而2950X则是16核心进行测试。 游戏测试,分别使用《斗阵特攻》、《绝地求生PUBG》、《刺客教条:起源》与《魔物猎人:世界》等四款游戏来测试,游戏都设定在1080p解析度、特效全开进行测试。 《斗阵特攻》游戏算是测试5个平台中表现较为平均的一款;而《绝地求生PUBG》就能看出2990WX因过多的核心导致游戏性能下降,而2950X则紧追在i97900X之后,相差约12fps的小差距。 《刺客教条:起源》相较于上两款射击游戏,更吃重了电脑性能,也因此2990WX完全讨不到便宜性能大减,但2950X则与i97900X差距仅5fps而已。 《魔物猎人:世界》同样是AAA等级大作,这款就能比出2950X与上代1950X的差距,且2950X紧追i97900X差距仅5fps。 游戏测试。 由于目前游戏对由多核心的支援,普遍最高仅在8核心,过多的核心反而让处理器时脉降低,在游戏表现上并不这么适合。 也因此针对RyzenThreadripper2990WX进行LegacyCompatibilityMode的测试,从原本32C关闭12核心、14核心来进行测试,换句话说2990WX关闭12核心,就相当于2950X的16核心,关到剩8核心时则近似于Ryzen72700的性能。 第二次测试可发现,在《斗阵特攻》与《绝地求生PUBG》这两款游戏测试时,8核心性能赢过16核心,但《刺客教条:起源》与《魔物猎人:世界》则是16核心性能赢过8核心。 由此可见,最适合游戏玩家的多核心处理器非RyzenThreadripper2950X莫属,而8核心设定或16核心设定,对于游戏平均fps性能差异较小。 RyzenThreadripper2990WX不同核心数游戏测试。 海量任务测试游戏录製《魔物猎人:世界》 从上述游戏测试可见2950X有着较好的游戏性能,对于游戏来说也用不尽2950X的16核心,于是乎就以OBS进行同时游戏与录製的工作,藉由OBS录製游戏影像与直播串流工作相当,因此为了方便测试则以录製的方式进行。 游戏则以最近刚出无疑是PCGame下半年强档的《魔物猎人:世界》来进行,游戏设定採1920x1080解析度、画面设定最顶级、帧率无上限、垂直同步关。而OBS录製设定为1920108060fps,使用CPUx264编码、CPU使用率:fast、位元率:60000。 从录製的《魔物猎人:世界》猎杀毒怪鸟的测试影片,可发现同时游戏OBS录製影像,CPU使用率约在6670之间,而游戏则维持在7085fps左右。 由此测试可见,AMDRyzenThreadripper2950X不仅有足够的游戏性能,16核心32执行绪更可同时游戏与OBS录製,对于游戏实况主来说,只需要一台电脑即可顺畅游戏同时直播。 document。write(); AMDRyzenThreadripper2950X《MonsterHunter:World》OBS录製测试。 《魔物猎人:世界》测试影片截图。 OBS录製设定。 OBS影像设定。 温度功耗RyzenThreadripper2990WX、2950X与i97980XE 本次测试皆使用ENERMAXLIQTECHTR4240来进行测试,于待机时测试的CPU温度都在35C左右。而在透过Prime95进行最大压力测试时,2990WX时脉维持在3GHz温度56C,而2950X时脉在3。5GHz温度55。9C。 至于对比的i97900X与i97980XE,使用同样的240mmAIO水冷,在Prime95测试下最高为i97900X3。6GHz温度82C、i97980XE3。2GHz温度74C;至于游戏时CPU温度普遍都不高。 温度测试。 整台电脑功耗,在待机时普遍都落在100W,同样Prime95烧机下,2990WX最高410W、2950X则278W,游戏测试时CPU未吃满功耗相对较低。 功耗测试。 AMDRyzenMaster与PBO自动超频 RyzenThreadripper2990WX与2950X处理器,只要散热器够力压的下处理器温度,都可藉由PrecisionBoost2,自动让处理器时脉提升,甚至可达到XFR2延伸时脉。 但若以手动超频设定,需考验玩家超频测试的经验,找到最适合的时脉、电压值,并确保系统可通过各式高负载程式的长时间测试;但RyzenThreadripper的客群,除了拼效能的超频、游戏玩家之外,亦有用于3D创作、渲染等工作需求,想要更多且稳定的多核心性能,但又不想将时脉、电压固定。 也因此,AMD推出PrecisionBoostOverdrive(PBO)的功能,只要主机板超频设定皆调整为Auto自动(时脉、电压等),并有着散热空间的前提下,透过RyzenMaster即可切换到PBO模式,玩家可自行调整处理器SoCPower与VRMCurrent,让处理器可获得更高的性能。 简单来说,PBO可以给予玩家更多的性能,并保有闲置自动降频(省电)与自动PrecisionBoost2的功能,比较表如下: 使用体验 出厂预设 手动超频 PBO nT频率 预设 使用者控制 PBO控制 电源限制 预设 使用者控制 提升 闲置降频 Yes No Yes 保固 Yes No No PrecisionBoost2 启动 Off 启动 性能 预设 提升 提升 玩家可在RyzenMaster软体中选择PrecisionBoostOverdrive的功能,并可自行调整PackagePowerTracking(PPT)、ThermalDesignCurrent(TDC)与ElectricalDesignCurrent(EDC)参数。 调整PackagePowerTracking(PPT),可提升提供给处理器的电压,让多核心、多线程的处理器,在超频时有着足够的电压。ThermalDesignCurrent(TDC)则是各家板厂对主机板VRM的温度限制,也意味着若要PBO获得更高的性能,必定要替主机板VRM进行解热。ElectricalDesignCurrent(EDC)调整主机板VRM给予处理器的最大电流。 倘若CPU散热足够,PBO可打破预设限制,提升主机板供电与电流,让处理器获得更多的自动超频空间。 PBO可让习惯Auto的玩家,透过简易的PPT、TDC与EDC来微调效能,不仅可让处理器运行在更高的时脉,并保有PrecisionBoost2与闲置降频省电的功能,这也是对于创作工作者来说,一来可提升更多效能,二来可比全手动Manual超频还要稳定。 以2990WX切换到PBO模式后,调整PPT900、TDC900、EDC500,即可让CinebenchR15成绩达到5928cb,轻轻鬆鬆就能比过Auto性能。 2990WX使用PBO超频。 至于,手边这两颗2990WX与2950X处理器,在240mmAIO水冷散热下,可达到全核心时脉几GHz呢? 这部分就直接手动超频,2990WX全核心时脉可达4。1GHz、1。35V电压,使用CinebenchR15测试CPU性能可达到6249分,全负载下CPU温度最高来到70C。 2990WX手动超频4。1GHz测试达6249分。 至于2950X测试下,全核心时脉可上4。3GHz、1。5V电压,这超频设定下CinebenchR15测试CPU性能可达到3640分,全负载下CPU温度最高82。6C。 2950X手动超频4。3GHz测试达3640分。 总结 AMD第2代RyzenThreadripper马力全开,32核心2990WX锁定3D创造、渲染、运算等专业应用,让用户可自行打造所需的工作站电脑;虽说单处理器价格1799美金(台湾定价57,999元),但对于希望藉由多核心运算(金钱)节省渲染、运算的等待时间,对于专业工作者来说,若有需求这肯定相对划算。 而与2990WX打对台的i97980XE,在台湾定价相当接近,但2990WX不仅有更多的核心、更强的运算性能,于CinebenchR15与POVRay有着33的性能领先;此外,2990WX更可透过PrecisionBoost2、PBO等技术得到接近超频的性能。 时间就是金钱,不是吗?2990WX测试Blender渲染Ryzen处理器,只需要8秒的时间。 WX锁定专业工作者,而X系列的RyzenThreadripper2950X,则锁定游戏玩家、性能狂热分子,玩家同样可获得更多的16核心,以及相近Intel平台的游戏性能。且第2代2950X本身预设时脉也较高,超频更可挑战全核心4。3GHz,整体游戏性能更胜1代1950X。 更何况2950X定价899美金更比1代发表时还便宜,可预期台湾2950X定价会与i97900X相当接近,就测试来看2950X有着更强的多核性能,即便游戏帐面上小输平均10fps左右,但同样可给玩家足够的游戏性能,更可藉由CPU同时游戏与直播,两者兼顾。 任务完成。 AMD设计Zen架构之初,不仅有着增强指令集平行,强化快取、预测引擎与同步多执行绪等设计,藉此提升处理器的运算性能输出。而更重要的策略则是Zen架构所拥有的扩展弹性,让AMD可以用与对手相近的价格,开启多核心的战争。 AMD第2代RyzenThreadripper维持着与对手相近价格,但有着更多的核心、更强的运算性能,并且处理器皆可超频等特色,首波先贩售2990WX,而在831则轮到2950X上阵,玩家可根据需求与预算,来打造RyzenThreadripper多核心体验。 来源:AMDRyzenThreadripper2990WX,2950X测试报告32C旗舰攻顶信仰爆棚