龙芯爱好者的日常!
返回

测试无聊的cpux,横向对比龙芯总分垫底,单核/Ghz又胜利了

2020-11-10 1343 1

  有些人很无聊啊。用个叫 cpux 的网页测试CPU性能,这只是一个用JavaScript计算hash的玩具,又不能测试浮点性能,也跑不了向量指令。测试内容太单一,对于评价CPU整体性能没有什么意义。就像某种CPU有计算CRC32的专用指令,计算CRC32特别快,就因此说这种CPU整体性能一定高那样不讲道理。

  用JavaScript计算hash,基本上谁的频率高谁就有优势,谁的浏览器优化得好谁就有优势。这些人用cpux的测试成绩对几款国产CPU横向对比,也就欺负一下工艺最老、频率最低、对浏览器的JS引擎优化最差的某款竞争产品了……

【图片】CPUX测试,龙芯垫底,飞腾集中,兆芯领先【中国芯吧】_百度贴吧tieba.baidu.com图标

  论对国产桌面CPU的软件优化,除了申威,就肯定是龙芯最差了,毕竟与x86和ARM相比,龙芯的用户少,开发者数量也少。不过呢,龙芯的软件优化因为基础最差,所以随着时间推移,只要有改进,进步就会比较明显。他们是用的是龙芯3A4000好几个月前的测试成绩,现在过了几个月了,我重新跑一下cpux吧,看看当前的系统和龙芯的浏览器优化得怎么样了。


测试无聊的cpux,横向对比龙芯总分垫底,单核/Ghz又胜利了


  测试结果很神奇呢,记得3A4000才发布时,有人测试这个cpux,得分好像是12000的样子,然后几个月前我自己测试的成绩就变成了21353,现在再测一次居然涨到了31526。这个涨幅有点大啊,不过和上面链接中的其它几款CPU相比,得分还是垫底的,谁让其它CPU都是16nm的工艺,而龙芯3A4000还是28nm工艺呢,频率也只是它们的2/3,确实有差距。

  要让CPU设计与生产工艺磨合得好,只能通过多次流片反复改进来积累数据和经验,而使用较先进的工艺也需要更多的钱,龙芯很穷,于是频率总是上不去。因此龙芯就喜欢把各种测试成绩折算到“单核/Ghz”来证明自己的设计水平没问题,我也这样做一个表格吧,把上面链接中的各款CPU的cpux测试成绩与我测试的整理一下:


测试无聊的cpux,横向对比龙芯总分垫底,单核/Ghz又胜利了


测试无聊的cpux,横向对比龙芯总分垫底,单核/Ghz又胜利了


  从上表来看,3A4000以1.8Ghz的频率,测试cpux的得分和其它的2.6Ghz+的国产CPU相差不大,最后那个明显高出一截的是8个核心,其它都是4核。如果换算到“单核/Ghz”呢,龙芯再次取得压倒性胜利,我都不好意思算百分比了。

  其实这个cpux测试就是一个玩笑,不同架构的CPU没有可比性,不同的浏览器没有可比性,不同的操作系统可能也没有可比性。并且这个测试的成绩受运行时的环境干扰很大,因为它是浏览器跑的,很多因素都会影响测试得分。

  但奈何某些人就是认这个测试,天天说某某不行,性能垫底,那我也就无可奈何的跑一个分出来让他们瞧瞧吧。

  嗯,龙芯3A4000的总分还是垫底,这就令我更加期待3A5000了,因为3A5000终于用上了与国内同行同等的生产工艺,哪怕还是没钱去做工艺磨合,频率也不会比1.8Ghz更低吧!更先进的工艺可以轻松提高频率,也能显著降低功耗,但是IPC(每周期执行指令数,可视为单核每Ghz的spec2006/2017测试得分)就只能靠设计。3A5000的IPC会比3A4000更高一些,而3A4000的IPC在使用GCC编译spec2006测试时,是与 AMD Zen1 差不多的,10分/Ghz。3A4000在2.0Ghz的频率下,spec2006 GCC测试的单核总分也是与3.4Ghz的AMD 打桩机/挖掘机差不多的,在20分+的水平上。

  (AMD官方文档:固定在3.4Ghz使用GCC 4.6 –O2编译的SPECint_base2006测试"Piledriver(打桩机)"和"Excavator(挖掘机)",得分分别为20.7和19.2。)

https://www.amd.com/system/files/documents/updated-3000-family-product-brief.pdfwww.amd.com

  "Piledriver" 和 "Excavator" 在使用ICC编译器测试 SPECint_2006时,得分为30+,但这主要是由于ICC开启了自动并行化,单核测试中的部分计算是用多核(4核)跑出来的,总成绩能提高50%左右。因此测试单核性能时如果要避免多核的并行的影响,就不要打开编译器的自动并行化。兆芯官网上公布的KX-6000(8核)系列在3.0Ghz时接近30分也是用ICC开自动并行后的成绩,其2.7G的CPU据其爱好者使用 GCC -O2 编译SPECint base2006测试仅14.9分,折算到3.0G约为16.56分,说明8核下开启自动并行后的测试成绩加成远高于4核。

  我假设使用更新版本的GCC编译器,并优化编译参数之后,"Piledriver(打桩机)"和"Excavator(挖掘机)"的peak成绩能够提高10%,那么则为22.77和21.12分。与塞西实验室测试的 3A4000@2.0Ghz 时的 SPECint_peak2006 21 分基本上是相同水平。

  据传闻龙芯3A5000的频率将为2.5~2.8Ghz,微架构有小改进,并更换到执行效率更高的、更先进的LoongArch指令集,那么它的GCC SPECint_peak2006得分预计将有30+,总分与AMD Zen1 用GCC编译的Spec2006的测试成绩就很接近了。但是频率仍然是硬伤,软件优化也还需要持续努力。


网友点评
  • 匿名用户:好棒!!!我也一直看好龙芯!!!向您学习!
    回复
顶部