fc2ブログ

Opteron 6380とOpteron 6272の比較

ebayで中古のOpteron 6380を入手しましたが、一部のメモリを認識しない不具合があり、返品することになりました。返品する前にOpteron 6272と比較してみました。

Opteron 6380 Abu Dhabi OR-C0 8モジュール16コア 2.5GHz 32nm SOI TDP115W
Opteron 6272 Interlagos OR-B2 8モジュール16コア 2.1GHz 32nm SOI TDP115W

●環境
マザーボード: SUPERMICRO H8SGL BIOS R3.5b
メモリ: DDR3-1600 Reg ECC 4GB×8
ビデオ: ASUSTeK GT730-SL-2GD3-BRK
SSD: SanDisk SDSSDA120G 120GB
HDD: HGST 0S03361 4TB
電源: Owltech EVEREST 85PLUS 520
ディスプレイ: 1024×768 32bit
OS: Windows 10 Pro 64bit
その他: Creative Sound Blaster Audigy LS、
  BD-REドライブ、USB FDD、USBカードリーダー、
  PS/2キーボード、PS/2マウス

●Opteron 6380
起動時最大:161W
アイドル時:74W
x264 FHD Benchmark実行時最大:197W
x264 FHD Benchmark:23.58 fps
P-State
Opteron 6380 AMD PSCheck

●Opteron 6272
起動時最大:144W
アイドル時:69W
x264 FHD Benchmark実行時最大:186W
x264 FHD Benchmark:19.49 fps
P-State
Opteron 6272 AMD PSCheck

●まとめ
Opteron 6380のTDPがどうして115Wのままで済むのか不明でしたが、コア電圧が低いことが分かりました。低電圧耐性の高い個体を選別しているのか、OR-C0になって低電圧が可能になったのか、分かりません。
確実にクロックが増加した分の性能は出ています。良いCPUだったのに残念です。

Core 2 Quad Q8300 SLB5WとSLGURの比較

以前Core 2 Quad Q8300とQ9300の比較を書いてから、VT-xに対応したQ8300の後期リビジョンSLGURが気になっていました。比較結果をまとめます。

●環境
CPU1: Core 2 Quad Q8300 SLB5W
CPU2: Core 2 Quad Q8300 SLGUR
マザーボード: MSI P35 Neo-F
メモリ: DDR2-800 1GB×4
ビデオ: 玄人志向 GF8400GS-LE256HD
HDD: Seagate ST3500418AS
電源: FSP300-60GHS
ディスプレイ: 1024×768 32bit
OS: Windows 7 Enterprise 64bit 評価版 SP1
その他: PS/2キーボード、PS/2マウス

●ベンチマーク結果
明確な差がないので省略します。

●消費電力
左がSLB5Wで右がSLGURです。

アイドル: 61W / 62W
OCCT LINPACK 5分間最大: 144W / 165W

一体なぜここまで差が出るのか分かりません。過去に入手したSLGURの別の個体も同様に消費電力が高かったので(そのときは不良かと思ってすぐに手放しました)、根拠はありませんが、元々VT-xに対応していて2次キャッシュが12MBある上位モデルのキャッシュを無効化している可能性があると思います。

Opteron 6128とOpteron 6272の比較

Opteron 6128が手に入ったので、Opteron 6164 HEとOpteron 6272の比較と同様に比較してみました。

Opteron 6128 Magny-Cours 8コア 2.0GHz 45nm TDP115W
Opteron 6272 Interlagos 8モジュール16コア 2.1GHz 32nm TDP115W

●環境
マザーボード: SUPERMICRO H8SGL BIOS R3.5
メモリ: DDR3-1600 Reg ECC 4GB×8
ビデオ: 玄人志向 RH6450-LE512HD/HS
HDD: HGST Deskstar 5K3000 2TB
電源: Owltech EVEREST 85PLUS 520
ディスプレイ: 1024×768 32bit
OS: Windows 7 Professional 64bit SP1
その他: Creative Sound Blaster Audigy LS
  BD-REドライブ、USB FDD、USBカードリーダー、
  PS/2キーボード、PS/2マウス

●消費電力
左が6128で右が6272です。

起動時最大: 149W / 166W
アイドル時: 91W / 74W
OCCT LINPACK 6分間最大: 206W / 206W

●ベンチマーク結果
左が6128で右が6272です。

CINEBENCH R15 CPU: 409 cb / 654 cb
SUPER PI 104万桁: 36秒 / 29秒
WEI プロセッサ: 7.5 / 7.7
WEI メモリ: 7.9 / 7.9

●まとめ
6128は元々6コアのうち2コアを無効にしたダイのMCMなので、ワットパフォーマンスの面では不利です。
電圧もTDP85Wを謳っている6164 HEよりかなり高く、アイドル時消費電力が高い原因になっているようです。
Opteron 6200シリーズ以降のほうが優秀です。

6128のP-StateとBIOS設定
Opteron 6128 P-StateOpteron 6128 BIOS設定

6272のP-StateとBIOS設定
Opteron 6272 P-StateOpteron 6272 BIOS設定

Opteron 6164 HEとOpteron 6272の比較

Opteron 6164 HE Magny-Cours 12コア 1.7GHz 45nm TDP85W
Opteron 6272 Interlagos 8モジュール16コア 2.1GHz 32nm TDP115W
の比較です。

●環境
マザーボード: SUPERMICRO H8SGL
メモリ: DDR3-1600 Reg ECC 4GB×8
ビデオ: 玄人志向 RH6450-LE512HD/HS
HDD: HGST Deskstar 5K3000 2TB
電源: Owltech EVEREST 85PLUS 520
ディスプレイ: 1024×768 32bit
OS: Windows 7 Professional 64bit SP1
その他: Creative Sound Blaster Audigy LS
  BD-REドライブ、USB FDD、USBカードリーダー、
  PS/2キーボード、PS/2マウス

●消費電力
左が6164 HEで右が6272です。
6272はアイドル時の消費電力が低いです。
メモリが4枚でも8枚でも変わりませんでした。

起動時最大: 129W / 156W
アイドル: 85W / 72W
OCCT LINPACK 6分間最大: 169W / 197W

●ベンチマーク結果
左が6164 HEで右が6272です。

CINEBENCH 11.5 CPU: 5.98 pts / 7.05 pts
SUPER PI 104万桁: 42秒 / 29秒
WEI プロセッサ: 7.3 / 7.7
WEI メモリ: 7.5 / 7.7

6164 HEのP-State
Opteron 6164 HE P-State

6272のP-State
Opteron 6272 P-State

AMD K10とBulldozerの比較

Bulldozerは性能が低い低いと言われますが、どの程度低いのか、同コア数同クロック同TDPのK10(Athlon II、Phenom II)と比較して実測してみました。

●環境
【K10】
CPU: Athlon II X4 615e

【Bulldozer】
CPU: Opteron 3250 HE

【共通】
クロック: 2.5GHz固定
コア数: 4
TDP: 45W
Cool' n' Quiet/Turbo CORE/APM: 無効
C1E/C-State: 有効
マザーボード: ASRock 880GM-LE FX BIOS P1.50
メモリ: DDR3-1333 2GB×2
ビデオカード: チップセット統合
HDD: Seagate ST3500418AS
電源: Owltech OWL-300SFX (FSP300-60GLS)
ディスプレイ: 1024×768 32bit
OS: Windows 8.1 Enterprise 64bit 評価版
電源オプション: バランス
その他: PS/2キーボード、PS/2マウス

●ベンチマーク結果
クリックすると大きな画像が出ます。
K10とBulldozerの比較
アーキテクチャが異なるため一概には言えませんが、同クロックのBulldozerはK10の8割程度の性能と考えて問題無いようです。L3キャッシュ無しのAthlon IIとL3キャッシュ有りのPhenom IIの性能差が殆ど無いこと(参考リンク)も分かっていますし、6÷8=0.75ですから、6コアのPhenom II X6から8コアのFXに乗り換えるメリットはあまりないという話も正しそうです。

ただし、OCCT LINPACK時の消費電力はK10のほうがずっと大きいので、クロックが低いとBulldozerのワットパフォーマンスはK10と同程度なのかもしれません。

クロック変動にしたらアイドル時消費電力はK10では38W、Bulldozerでは47Wまで下がりました。Bulldozerのアイドル時消費電力が高いのは、4モジュールのうち2モジュールが無効にされたモデルだからなのか、L3キャッシュが影響しているのか、マザーボードの設計のせいなのか、不明です。

Athlon II X4 615eのP-State
Athlon II X4 615e P-State

Opteron 3250 HEのP-State
このモデルでは最小クロックが1400MHzではなく1200MHzまで下がります。
Opteron 3250 HE P-State

Sandy BridgeとBulldozerの比較

IntelのSandy BridgeマイクロアーキテクチャとAMDのBulldozerマイクロアーキテクチャの性能差は実際のところどうなのか、コア/モジュール数、スレッド数、クロックが同一なXeon E3-1260LとOpteron 3280で比較してみました。

●環境
【Sandy Bridge】
CPU: Xeon E3-1260L
マザーボード: ASUSTek P8B75-M

【Bulldozer】
CPU: Opteron 3280
マザーボード: ASRock 880GM-LE FX

【共通】
クロック: 2.4GHz
コア/モジュール数: 4
スレッド数: 8
Turbo Boost/Turbo CORE: 無効
EIST/CnQ: 有効
C1E: 有効
メモリ: DDR3-1333 4GB×2
ビデオカード: 玄人志向 RH6450-LE512HD/HS
HDD: Seagate ST3500418AS
電源: Owltech OWL-300SFX (FSP300-60GLS)
ディスプレイ: 1024×768 32bit
OS: Windows 7 Enterprise 64bit 評価版 SP1
その他: PS/2キーボード、PS/2マウス

●ベンチマーク結果
クリックすると大きな画像が出ます。
Sandy BridgeとBulldozerの比較
Sandy Bridgeと比較して、Bulldozerの演算速度は8割程度、x264エンコード速度は同等、消費電力は4割増しです。体感と大体同じだと思います。ただし、ASRock 880GM-LE FXの消費電力は高めなので、ASUSやMSIのマザーボードに交換したらもう少し低くなるかもしれません。

Opteron 3280はDDR3-1600でも試しましたが、消費電力含めて0.5~2%程度の向上に留まりましたので結果の掲載は中止しました。

Xeon E3-1260Lはずっと2.5万円程度だったのに対し、Opteron 3280は2.2万円から始まって最安1万円まで下がったので、値段を考えたらBulldozerも十分ありだと思います。

Core 2 Quad Q8300とQ9300の比較

Core 2 Quad Q8300とQ9300の違いは、2次キャッシュの量と仮想化機能の有無だけです。
2次キャッシュが少ないと消費電力も少ないと言われますが、本当かどうか検証してみました。

●仕様
【共通点】
クロック: 2500MHz
コア数: 4
製造プロセス: 45nm
コードネーム: Yorkfield
ソケット: LGA775
TDP: 95W

【相違点】
sSpec: SLB5W / SLAWE
ステッピング: R0 / M1
L2: 4MB / 6MB
VT-x: 無し / 有り

●環境
マザーボード: J&W JW-N7AS-HD
メモリ: DDR2-800 4GB×2
ビデオ: オンボード
HDD: Seagate ST31000528AS
電源: 玄人志向 KRPW-V560W
ディスプレイ: 1024×768 32bit
OS: Windows Vista Home Premium 64bit SP2
その他: PS/2キーボード、PS/2マウス

●ベンチマーク結果
左がQ8300で右がQ9300です。
Q9300はキャッシュが多いせいかメモリスコアがわずかに良く、全体的に微増しています。

PCMark Vantage: 4664 / 4919
3DMark Vantage: 611 / 608
CrystalMark 2004R3: 149492 / 150460
HDBENCH 3.40: 159216 / 159276

●消費電力
左がQ8300で右がQ9300です。
OCCT LINPACKは最大値だけ見ると3Wしか違いませんが、平均値は4W以上差があるように見えました。

起動時最大: 108W / 107W
アイドル: 44W / 46W
スタンバイ: 3W / 3W
OCCT LINPACK 5分間最大: 127W / 130W

消費電力命であれば、VT-xに対応したQ8300の後期リビジョンSLGURがベストかもしれません。

K7、K8、P6、Netburstアーキテクチャ間の比較

Pentium IIIとPentium 4は同クロックでどれぐらいの差があったのか?
Pentium IIIがそのままクロック向上していたらどれぐらいの性能になったのか?
AthlonとOpteronは同クロックでどれぐらいの差があったのか?

これらを確認するために、PCを解体する前にデータを取ってみました。
最近のアーキテクチャ(K10、Core、Nehalem)も同クロックでデータを取っています。

●環境
Pentium IIIの最高定格クロックがOpteronの最低定格クロックと同じ1.4GHzなので、これに合わせました。
また、最近のデュアルコアプロセッサと比較するため、デュアルプロセッサ環境としました。

CPU1: Geode NX 1750、Athlon MP 1600+相当 1.4GHz×2 (定格)
CPU2: Opteron 240 EE 1.4GHz×2 (定格)
CPU3: Pentium III-S 1.4GHz×2 (定格)
CPU4: Xeon MP 1.4GHz×2 (定格)
CPU5: Athlon II X2 250u 1.4GHz (倍率下げ)
CPU6: Pentium E2220 1.4GHz (倍率下げ)
CPU7: Core i3 540 1.4GHz (BCLKを140MHzにOC&倍率下げ)
メモリ: 512MB×4
HDD: Seagate ST3500418AS (+変換名人 IDE-SATAZD2
ビデオカード: RADEON 9600 XT または X600 XT、どちらも同クロック
その他: 光学ドライブ、FDD
OS: Windows XP Professional SP3

●ベンチマーク結果
クリックすると大きな画像が出ます。
1.4GHz比較 ベンチマーク結果
P6が意外と高性能です。K8とそんなに変わりません。Netburstの性能がいかに低かったかということが良く分かります。
NehalemはP6比で1.5~2倍ぐらいあります。
K7のHDD書き込み速度が出ていないのは、変換アダプタとの相性問題と思われます。

Sandy BridgeのCeleronも手元にありますが、最低倍率が16倍で、BCLKも下げられないので比較できませんでした。残念です。

Phenom II X4 905e C2ステッピングとC3ステッピングの比較

今更ですが、Phenom II X4 905e と Athlon II X4 615e の比較以来ずっと気になっていたので比較してみました。

●環境
CPU1: Phenom II X4 905e C2 HD905EOCGIBOX
CPU2: Phenom II X4 905e C3 HD905EOCGMBOX
CPU3: Athlon II X4 615e C3 AD615EHDGMBOX
マザーボード: ASRock A785GMH/128M
メモリ: DDR2-800 4GB×4
ビデオ: オンボード
HDD: Seagate ST3500418AS
電源: Owltech OWL-300SFX (FSP300-60GLS)
ディスプレイ: 1024×768 32bit
OS: Windows 7 Enterprise 64bit 評価版 SP1
その他: PS/2キーボード、PS/2マウス

●外見
CPUそのものの外見は全く同じなので省略します。

箱。左から905e C2、C3。ただし、C2でも後期のものは右の省スペースパッケージの場合があるようです。
Phenom II X4 905e Box

クーラー。左から905e C2、C3。単にロットの違いで、ステッピングの違いに起因するものではないと思われます。
Phenom II X4 905e Cooler

●P-state
K10statの画面です。左から905e C2、905e C3、615e C3。何と905e C3のほうが0.025V低くなっています。ただしノースブリッジは0.05V高くなっています。
Phenom II X4 905e C2 P-statePhenom II X4 905e C3 P-stateAthlon II X4 615e P-state

クロック
P0: 2500 / 2500 / 2500
P1: 1900 / 1900 / 2100
P2: 1400 / 1400 / 1800
P3: 800 / 800 / 800

CPU電圧
P0: 1.1750 / 1.1500 / 1.1000
P1: 1.1250 / 1.1000 / 1.0250
P2: 1.0500 / 1.0250 / 0.9500
P3: 0.9750 / 0.9500 / 0.8750

NB電圧
P0: 1.1000 / 1.1500 / 1.1000
P1: 1.1000 / 1.1500 / 1.1000
P2: 1.1000 / 1.1500 / 1.1000
P3: 1.1000 / 1.1500 / 1.1000

●ベンチマーク結果
左から905e C2、905e C3、615e C3。誤差程度だと思いますが、CrystalMarkとHDBENCHでは、905e C3のFPUがわずかに低くなり905e C3のMEMがわずかに高くなりました。

PCMark 7: 1889 / 1860 / 1825
3DMark Vantage: 283 / 286 / 272
CINEBENCH R11.5 OpenGL: 4.27 / 4.27 / 4.25
CINEBENCH R11.5 CPU: 2.93 / 2.93 / 2.78
CrystalMark 2004R3: 146858 / 145038 / 148082
HDBENCH 3.40: 153588 / 154642 / 154992

●消費電力
左から905e C2、905e C3、615e C3。わずかですが差が出ました。

起動時最大: 88W / 88W / 81W
アイドル: 45W / 43W / 36W
スタンバイ: 4W / 4W / 4W
OCCT LINPACK 5分後: 131W / 125W / 109W

それにしてもL3の有無だけでこれだけ電圧と消費電力に差が出るというのが驚きです。

Transmeta Crusoe TM5800 System Development Kit その3

Crusoe TM5800 SDK 6
HDBENCH Ver 3.40 beta 6の実行結果です。

整数演算のスコアはPentium III 850MHzと同等のようですが、実際はそれより遅く感じます。遅い原因は、まずCMSによってネイティブコードに変換されるオーバーヘッドが掛かることと、どこかで見ましたが、Crusoeには専用のDMAコントローラが無くCPUが兼ねているため、プログラムの実行とI/Oが同時にできないことのようです。HDDの書き込みが異常に遅いのもそのせいかもしれません。

Crusoe TM5800 SDK 7
CrystalMark 2004R3 0.9.126.452の実行結果です。

Crusoe TM5800 SDK 8
Crusoe TM5800 SDK 9

CrystalMark 2004R3 0.9.126.452の実行結果出力です。