打印本文 打印本文  关闭窗口 关闭窗口  
绝地反击 AMD原生四核BARCELONA性能实测
作者:陈鹏  文章来源:本站原创  点击数  更新时间:2008/1/16 22:54:34  文章录入:陈鹏  责任编辑:陈鹏

原生四核心处理器:

一直以来AMD都在向外宣传该公司将要推出的Barcelona处理器将会是世界上首款原生四核心处理器,而intel公司当前的四核心处理器实际上是两个双核心处理器拼起来的。原生四核心将会带来更好的性能提升比例,同时在通过缓存进行数据交换的速度也将会更快。

为了证明这一点,我们使用Cache2Cache进行了测试(实际时间为双倍时间):

Cache 同步 (ns)
相同核心,不同封装
不同核心,相同封装
不同核心, 不同封装
Opteron 2350
152
N/A
199
Xeon E5345
59
154
225
Xeon DP 5160
53
-
237
Xeon DP 5060
201
N/A
265
Xeon 7130
111
N/A
348
Opteron 880
134
N/A
169-188

从测试结果来看,AMD的原生四核心与1级缓存进行数据交换需要用时76ns。这个结果应该不坏,但是却比不上Xeon处理器二级缓存26-30ns的。如果是0号核心与3号核心进行数据互传,那么Intel所需时间不到77ns,而 Opteron用时为76ns。因此复杂的三级缓存设置会对原生四核心设计带来负面影响,不过这我们将会在以后进行的更复杂的测试中进行研究。

存储系统:

AMD公司这一次对新款 Opteron 处理器的内存性能进行的有效的提升,在该处理器上也许只有1级缓存基本没有什么变化:与K8处理器的一级缓存一样都为2路64KB。与目前所有的处理器一样,Opteron 2350同样能够在每一个时钟循环进行16 bytes传输。

Lavalys Everest L1 带宽
读取 (MB/s)
写入 (MB/s)
复制(MB/s)
Bytes/循环 (读取)
延时 (ns)
Opteron 2350 2 GHz
32117
16082
23935
16.06
1.5
Xeon 5160 3.0
47860
47746
95475
15.95
1
Xeon E5345 2.33
37226
37134
74268
15.96
1.3
Opteron 2224 SE
51127
25601
44080
15.98
0.9
Opteron 8218HE 2.6 GHz
41541
20801
35815
15.98
1.1

在AMD公司过去处理器产品上,二级缓存的带宽一直是一个弱点。回首K7雷鸟的时候,AMD只是简单得将二级缓存放进核心内。结果就是通过L2与L1的64bit的传输带宽只能够在每个时钟循环实现2.4 至 3 bytes的传输。虽然在K8架构上传输性能提升了50%,但是依然要远落后于intel公司的二级缓存。但是在Barcelona架构下,一级缓存的数据传输带宽将可以达到 256-bit:

Lavalys Everest L2 带宽
读取(MB/s)
写入 (MB/s)
复制 (MB/s)
Bytes/循环 (读取)
Bytes/循环 (写入)
Bytes/循环(复制)
延时 (ns)
Opteron 2350 2 GHz
14925
12170
13832
7.46
6.09
6.92
1.7
Dual Xeon 5160 3.0
22019
17751
23628
7.34
5.92
7.88
5.7
Xeon E5345 2.33
17610
14878
18291
7.55
6.38
7.84
6.4
Opteron 2224 SE
14636
12636
14630
4.57
3.95
4.57
3.8
Opteron 8218HE 2.6 GHz
11891
10266
11891
4.57
3.95
4.57
4.6

对比
Bytes/循环 (读取)
Bytes/循环 (写入)
Bytes/循环(复制)
Barcelona VS Santa Rosa
63%
54%
51%
Barcelona VS Core
-1%
-5%
-12%
Santa Rosa VS Core
-39%
-38%
-42%

相对于 K8,Barcelona的带宽提升幅度大约在50%-60%。这次我们同样也测试了15个循环的延迟,可以看到现在AMD的二级缓存性能与Intel Core缓存差不多。

接下来让我们看看这一次Barcelona在内存性能上究竟可以带来什么样的提升,首先进行的是Lavalys Everest 4.0.11:

Lavalys Everest 内存测试
读取 (MB/s)
写入 (MB/s)
复制 (MB/s)
Bytes/循环 (读取)
Bytes/循环 (写入)
Bytes/循环 (复制)
延时(ns)
Opteron 2350 2 GHz
5895
4463
6614
2.95
2.23
3.31
76
Dual Xeon 5160 3.0
3656
2771
3800
1.22
0.92
1.27
112.2
Xeon E5345 2.33
3578
2793
3665
1.53
1.2
1.57
114.9
Opteron 2224 SE
7466
6980
6863
2.33
2.18
2.14
58.9
Opteron 8218HE 2.6 GHz
6944
6186
5895
2.67
2.38
2.27
64

Lavalys Everest 对比
Bytes/循环 (读取)
Bytes/循环 (写入)
Bytes/循环 (复制)
延时(ns)
Barcelona VS Santa Rosa
26%
2%
54%
29%
Barcelona VS Core
92%
86%
111%
-34%
Santa Rosa VS Core
74%
99%
44%
-44%

凭借更深的缓存以及更富裕的 2x64-bit互通有效得提升了读取带宽,不过写入缓存则有一些负面影响。但是这不会有什么实际影响,毕竟只。有很少的应用会专门等待这个较长的时间,这里可以注意到每一个循环复制带宽提升了大约54%。

因此借助更大的二级缓存、内存带宽以及更低的延迟,第三代 Opteron处理器也许是你能找到的内存性能最高的处理器产品。接下来就让我们看看如此出色的内存性能究竟在实际的应用中会为我们带来什么样的好处

上一页  [1] [2] [3] [4] [5] [6] [7]  下一页

打印本文 打印本文  关闭窗口 关闭窗口