值得买科技-分享、推荐高性价品牌产品购物排行榜!

「龙芯」龙芯3A5000评测国产自主指令集架构实战

中关村在线 真实性核验

认证:数码产品优质原创作者

发布时间:2021-10-28 15:11 来源:什么值得买

浏览量:1740 1020次收藏

分类:数码产品

本文有3636个文字,大小约为15KB,预计阅读时间10分钟

原文标题:龙芯3A5000评测国产自主指令集架构实战

芯片,是世界一大难题,很多人难以想象电子硬件中最小巧的的元件反而拥有最高技术含量,其中蕴含的逻辑就相当于以纳米为单位修建一座城市。

芯片器件中最著名的产物是CPU,国内 CPU 行业经历步履维艰的发展,关注度越来越高,在政务、通讯、计算等领域经常可以看到国产 CPU 的身影。但通用 CPU 领域还是国外 CPU 占据主导。桌面端有英特尔和AMD,移动端有 ARM 和高通等企业,国产 CPU 想要突出重围并不容易。

龙芯 3A5000产品综述|图片 ( 1 ) |参数|报价|点评 ( 1 )

这些年国内 CPU 企业在不断发展的同时也在寻找破局之法,国内 CPU 厂商最常见的发展模式是购买指令集架构授权,ARM、MIPS 甚至 X86 均有国内 CPU 企业获得了授权。购买指令集架构授权无疑是一种高效的手段,相当于在别人准备好地基的土地上建房子,产品不能称为完全国产自主。不过授权终究是授权,没有相应产权的保护,依旧可能会受到制约。

01 LoongArch 介绍

在 2021 年 4 月,龙芯中科率先在国产自主化跨出一步,宣布推出完全自主指令集架构:LoongArch,顶层架构到指令功能和 ABI 标准完全自主。这表明龙芯中科未来的 CPU 不再使用 MIPS 指令集架构,从今年推出的3A5000开始都将使用 LoongArch 架构,这无疑是芯片国产化的重要里程。

我们参照官方的资料,做了一下龙芯 3A5000 的微架构图,可以粗略看到 3A5000 大体分为 4 个区块,每个区块包含一个核心和一个缓存。

根据官方的资料,LoongArch 依旧属于 RISC 阵营,拥有 RISC 的特点,比如 32 位定长指令,32 个通用寄存器,32 个浮点 / 向量寄存器。但 LoongArch 也进行了改进,取消了 RISC 的指令延迟槽,直接跳转指令的目标地址相对 PC 计算,增加相对转移偏移量。

LoongArch 拥有近 2000 条指令,并充分考虑兼容需求,相同的源代码编译成 LoongArch 比编译成龙芯此前支持的 MIPS 时动态执行指令数减少 10%-20%,也就是运行效率更高,性能也会提升。

LoongArch 还深入研究了 MIPS、X86、ARM 的特性,能对这些主流架构进行二进制翻译,对 MIPS 可以实现 100% 的翻译,能实现跨平台兼容,龙芯目标是在 2025 年的时候消除指令集之间的壁垒。

2021 年 7 月,龙芯中科发布了两款基于 LoongArch 指令集架构的处理器:3A5000 和 3C5000L。3A5000 处理器是面向桌面端的产品,3C5000L 则是服务器处理器。 3A5000 主频为 2.3Ghz-2.5GHz,拥有 4 颗核心,每个处理器核心采用 64 位 LA464 自主微结构,支持 DDR4-3200MHz 内存,支持 Hyper Transport 3.0 控制器。3C5000L 则由 4 个 3A5000 封装,拥有 16 个核心。

3A5000 处理器内置了安全模块,可以对 Meltdown ( 熔断 ) 和 Spectre ( 幽灵 ) 两个经典 CPU 漏洞有效免疫,与上一代 3A4000 一样支持内置加解密算法和安全可信模块,也是目前唯一通过国内商密二级型号鉴定测试的 CPU 内置模块。

02 龙芯 3A5000 整机介绍

龙芯 3A5000 通用处理器主要应用在消费级桌面市场,未来会推出包括台式机、笔记本、一体机等产品,这次我们拿到了搭载 3A5000 处理器的台式整机产品,龙芯 3A5000 整机在外观上采用经典的商用办公主机风格,以黑色为主格调,前面板提供一个常规开关按钮,两个 USB 2.0 接口,两个音频输入 / 输出接口。

龙芯 3A5000 整机

主板 I/O 处,提供一个 VGA 视频口,一个串行 COM 接口,4 个 USB 2.0 接口,2 个 USB 3.2 Gen1 5Gbps 接口,一个有线网口。

主板 I/O

其他配件上,这台主机使用了 256GB 的 SATA 固态,双 8GB DDR4 3200MHz 内存。显卡为 AMD Radeon HD 8750M,显卡 I/O 提供一个 VGA 接口,一个 HDMI 接口。

紫光国芯(UnilC)2*8GB DDR4 3200MHz 内存

AMD Radeon HD 8750M

卸下散热器,可以看到这次的主角:龙芯 3A5000,龙芯 3A5000 的芯片代号为 "KMYC70",这样命名是纪念抗美援朝 70 年,而服务器 3C5000L 芯片代号则为 "CPC100" 以庆祝建党 100 周年。

这台主机中,龙芯 3A5000 直接焊接封装在主板上,不支持 DIY 更换。

编译器方面,龙芯 3A5000 配套的三大编译器 GCC、LLVM、GoLang 和三大虚拟机Java、JavaScript、.NET均已完成开发,龙芯自家基础版操作系统 Loongnix 和面向工控领域的 LoongOS 已经发布,不过我们手里这台龙芯 3A5000 整机使用的为统信 UOS 系统,因为优化等问题,会与 Loongnix 及其他系统的龙芯 3A5000 主机性能有差异。

主机配置

统信 UOS 系统由多家国内操作系统核心企业自愿发起并研发完善的安全、易用、稳定的操作系统产品,也是未来芯片国产化的生态关键一步。其官网目前已经开放下载,有兴趣的用户可以自行去官网下载尝试。那么除了统信 UOS 操作系统之外,实际上国内自主开发的操作系统麒麟 Kylin 龙芯版也是不错的选择。

03 实战测试:

此次参与测试的处理器除了龙芯 3A5000 之外,还增加了intel i5 9500 六核 14nm 处理器、国产 ARM V8 四核 7nm 处理器和国产 ARM V8 八核 14nm 处理器作为对比参考,整机主要的硬件参数保持一致。

其中, intel i5 9500 六核 14nm 架构处理器主频 3.0-4.4Ghz,热设计功耗 65W。国产 ARM V8 四核 7nm 处理器主频可达 2.6GHz,单芯片可支持 64 核。另一款国产 ARM V8 八核 14nm 处理器,兼容 64 位 ARMv8 指令集,主频 2.3GHz。

需要提前说明的是,参与测试的四款处理器核心数量并非一致,因此在多核测试项目中我们取处理器的最多核数成绩。

基准测试

UnixBench 性能测试:

下面我们正式开始测试,首先依然选择大众熟悉的 UnixBench 测试工具。这款软件是一个类 Unix(Unix,BSD,Linux)系统下的性能测试工具,被广泛用于测试 Linux 系统主机的性能。可以测试系统调用、读写、进程、图形化测试等成绩,也是一个全方面考验整机的软件。

UnixBench 单核、多核性能测试

从测试结果可以看到,龙芯 3A5000 和国产 ARM V8 四核 7nm 这款处理器的性能表现都很出色,龙芯 3A5000 单核性能达到了 1685 分,相比上一代龙芯 3A4000提升非常明显,单核性能已逼近了 intel i5 9500 六核 14nm 这款处理器的水平。这一点也正符合龙芯先通过设计优化提高单核性能,再利用先进工艺增加核数的升级策略。

多核性能对比中,龙芯 3A5000 达到 4314 分与国产 ARM V8 四核 7nm 的 4387 分基本持平,但如果与 intel i5 9500 六核 14nm 对比还是有不小差距。不过,4 核龙芯 3A5000 反而比国产 ARM V8 八核 14nm 这款处理器的性能高出了 600 多分。

SPEC 2006 测试:

接下来我们进行 SPEC 2006 对比测试,SPEC 2006 是一个大型的 CPU 性能测试项目,重点测试系统的处理器,内存子系统和编译器。能够测试 CPU 最基础的定点性能和浮点性能。同样需要提前说明的是,测试处理器由于核心数量并不对等,因此我们在多核测试环节选择最多核数的成绩。

SPEC CPU2006 BASE 性能测试

本次我们将 SPEC 2006 测试分为单核与多核测试。龙芯 3A5000 单核定点为 25.1 分,单核浮点为 26 分。相比 intel i5 9500 六核 14nm 这款处理器的确有不小的差距,但单核定点与国产 ARM V8 四核 7nm 这款处理器不相上下,单核浮点略优于国产 ARM V8 四核 7nm 这款处理器。龙芯 3A5000 对比国产 ARM V8 八核 14nm 处理器的单核定点则高出近 10 分,单核浮点则高出近一倍。

多线程测试中,intel i5 9500 六核 14nm 处理器依然表现最佳,而龙芯 3A5000 的多核定点与多核浮点均高于国产 ARM V8 四核 7nm 处理器,由于国产 ARM V8 八核 14nm 处理器核心数量上具有一定的优势,因此定点和浮点的分数要高于龙芯 3A5000 和国产 ARM V8 四核 7nm 处理器。

Stream:

Stream 是业界主流的内存带宽测试程序,测试行为相对简单可控。 该程序对 CPU 的计算能力要求很小,对 CPU 内存带宽压力很大。 随着处理器核心数量的增大,而内存带宽并没有随之成线性增长,因此内存带宽对提升多核心的处理能力就越发重要。

Stream 内存测试

在 Stream Copy 测试子项性能中,龙芯 3A5000 的表现相当出色,已超过了 intel i5 9500 六核 14nm 处理器。其中 Copy 单线性能获得 16864 分,多线性能获得 21873 分。国产 ARM V8 八核 14nm 处理器和国产 ARM V8 四核 7nm 处理器分数相差不大,但 Copy 的整体表现比龙芯 3A5000 稍逊一筹。

应用测试

实际上,除了处理器的单核与多核的基准性能测试之外,用户软件应用体验则可以更直观反应处理器之间的性能差异,下面我们就来实测一下办公常用WPS、浏览器与视频播放器方面的应用体验。

WPS:

我们将搭载四款处理器的主机安装上同样版本的统信 UOS 操作系统,然后用 WPS办公软件分别打开 10MB(文本 + 图片)、50M(文本 + 图片)以及 50M(文本 + 图片 + 视频)单个大容量文件,重点测试打开文档速度来衡量处理器的性能,为了尽可能保证测试数据样本的规律性,每个文档均打开 5 次后取平均值。

WPS 办公软件打开文档速度对比 ( 时间越短越好 )

通过实际测试可以看到,10MB(文本 + 图片)文档打开速度中,国产 ARM V8 八核 14nm 处理器用时最短为 1.47 秒,龙芯 3A5000 打开速度为 1.54 秒。50M(文本 + 图片)打开速度中,国产 ARM V8 四核 7nm 处理器用时最长为 3.01 秒,50M(文本 + 图片 + 视频)测试中,国产 ARM V8 八核 14nm 处理器则用时最长为 4.24 秒,intel i5 9500 六核 14nm 处理器用时最短为 2.23 秒。综合来看,intel i5 9500 六核 14nm 处理器的整体表现较好,而龙芯 3A5000 略好于国产 ARM V8 四核 7nm 处理器,国产 ARM V8 八核 14nm 处理器小容量文件打开文件速度较好,但是大文档打开速度上不够理想。

浏览器:

浏览器是我们日常观看网页信息和视频的重要应用,目前每个网页基本上都充斥着大量的图形,对于 CPU 运行也会打来不小的负荷压力。下面我们就来测试一下四款处理器在浏览器上的性能表现。我们同时打开浏览器并加载爱奇艺视频网站,对比一下打开时间。由于龙芯自家提供有 Loongnix 浏览器,因此龙芯 3A5000 选择自家龙芯浏览器 V3.1,而其他均选择火狐浏览器进行测试。

浏览器打开爱奇艺网站速度 ( 时间越短越好 ) 单位:秒

由于爱奇艺网站中存在视频、图片、CSS、JavaScript 等等,因此加载页面对处理器性能也提出一定的要求。通过测试可以看到 intel i5 9500 六核 14nm 处理器加载速度表现较好用时 1.4 秒,龙芯 3A5000 的 1.78 秒也很不错,最长用时的则是国产 ARM V8 八核 14nm 处理器用时 2.35 秒。

影音播放:

最后对比测试的是影音播放性能,我们选择统信 UOS 操作系统下的默认视频播放器,并打开同样大小的 1080P 视频 mp4 格式,分别测试四款处理器加载视频的时间。

影院播放器加载 1080P MP4 视频时间 ( 时间越短越好 ) 单位:秒

通过实测可以看到,国产 ARM V8 四核 7nm 处理器加载速度最快为 1.43 秒,龙芯 3A5000 为 1.64 秒紧随其后,最慢的则是国产 ARM V8 八核 14nm 处理器用时 2.09 秒。此外值得一提是,由于龙芯 3A5000 处理器性能提升显著,因此在播放 4K 高清视频的软解能力也得到进一步提升,在脱离独显的情况下依然可以流畅播放高清视频。

04 不破不立 不断超越

长久以来,龙芯中科的目标是让中国人用上完全自主的 CPU 处理器,二十年风华岁月,弹指一挥间,LoongArch 的出现让龙芯离这个目标迈进了一大步,这也不仅仅是龙芯的突破,也是中国自主 CPU 行业的新里程碑。

基于自主指令系统 LoongArch 的龙芯 3A5000 性能表现非常让人满意,短期内的短板是生态建设,应用软件适配还需要加强。尽管作为过渡阶段,龙芯的二进制翻译系统 LAT 可以实现跨指令平台应用兼容,也能够运行部分 X86/Windows 应用软件,但要想实现满足各种应用需求的庞大软件生态,仍需要国内软件厂商的群策群力。

生态涉及的复杂程度有时候会比单一技术还要令人头痛,CPU 生态需要硬件、系统和用户作为支持,硬件上龙芯已经有了 LoongArch 加持的龙芯 3A5000,系统方面有统信 UOS、麒麟 Kylin 等国产操作系统的适配。LoongArch 目前最需要的是用户,用户不仅包括消费者,也包括开发者,没有开发者带来的软件生态支持,就不会有大量消费者买单,没有用户消费就没有资金继续研发,所以 LoongArch 大力推广生态是当下最重要的一步。苹果 M1 被认为可以威胁到英特尔和 Windows,也是因为用户基数庞大,加上全球上千万的 iOS 开发者,才能成为 CPU 行业的黑马。

有些用户可能比较难理解,为啥我们 CPU 做了那么多年,国内 CPU 生态还是建立不起来。这里笔者举个例子,前段时间有消息称英特尔要在欧洲建立一座晶圆厂,投入是多少呢?消息显示英特尔整个生命周期内总投资或将超过 1000 亿美元,即使包括一些国家的政策补贴,英特尔每年在芯片研发上也有百亿美元投入。国内 CPU 整个行业实际投入都远低于英特尔这样的企业,根本不能满足所有芯片企业的需求,大多只勉强维持研发。而且,国外 CPU 和操作系统在软件生态、产业体系上磨合了几十年。正所谓差之毫厘,谬之千里,一个微小细节失误就会让一条亿万投入的产品线作废,没有资本必然玩不转,门槛高,难入行,久而久之活下来的越来越少。

在这样的环境下,龙芯能够推出自主化指令集架构 LoongArch 实属不易,准确的说像龙芯这样现在还坚持做国产自主芯片的企业都值得尊敬。

不经一番寒彻骨,怎得梅花扑鼻香,自主之路无比艰难,龙芯这份勇气令人赞叹。现在龙芯已经踏出最艰难的第一步,接下来就是生态体系的建立。目前龙芯中科已经建立 LoongArch 社区,同时将会组建 LoongArch 联盟,免费开放 LoongArch,希望更多的开发者可以参与其中,让国产自主 CPU 走的更远,期待龙芯中科为我们带来全新自主的国产 CPU 生态领域。

更多文章:300多元的国产吸尘器之光,网易智造T110无线吸尘器值不值得买?

其他人还看了

国产DOOGEE将进军平板电脑市场,首款T10搭载紫光展锐T606芯片和双立体声扬声器

「英伟达」不止是游戏党,他们才是被英伟达坑怕的人。

「奥斯汀」苹果M3准备登场,库克展示奥斯汀AppleSilicon工程团队努力成果

「小米」终于来了,这绝对是今年最猛的新机

苹果xr充满电会自动断电吗(苹果xr有没有电池管理芯片)

哎呦不错哦,赞!(218)

郑重声明:本文“「龙芯」龙芯3A5000评测国产自主指令集架构实战”,https://nmgjrty.com/shumacp_228807.html内容,由中关村在线提供发布,请自行判断内容优劣。

上一篇:「昂达」十二代酷睿发布昂达Z690魔剑携黑科技即将登场

下一篇:「荣耀」更香了!双11购买荣耀Magic3官方最高追加500元补贴

说点什么吧
  • 全部评论(0
    还没有评论,快来抢沙发吧!
相关推荐

tags标签

返回顶部