Pentium Proのマザーボードを比較する。
Pentium Pro(長ったらしい名前だ..)用のマザーボードを入手した。
一枚はORIONチップセットと言われる、第一世代のチップが乗ったモノ。
もう一枚は現行モデルの、NATOMAチップセットが乗ったモノだ。
ORION(GX)チップセットは、マルチCPUやメモリインタリーブをサポートした高機能チップだ。
それに対してNATOMAは、外部バスへのアクセス速度改善や高集積化を盛り込んだ第二世代チップ。
さてその性能はどんなものだろう?
コイツがNATOMAの乗ったASUS-P/I-P6RP4マザーだ。
VRMは外して有るが、CPU横の白いコネクタに挿さる仕組みだ。
小型のマザーが増えた中、コイツは奥行き方向めいっぱいの寸法がある。
面白いのは、CPU用のクロック発振器が独立していることで、最近のマザーとしては珍しい。
コイツを交換することでマザークロックを60MHzだろうが80MHzだろうが、好きに設定できる。
ほぼ同じ解像度でスキャンしたASUS-P/I-P6NP5マザー。
VRM機能はオンボードになっている。
チップセットの数が減ったこともあって小型化が行われているが、小型化する事によるコストダウンは結構大きいそうだ。
基板の価格は寸法に比例するから、できるだけ小さく作りたいところだ。
それではパフォーマンス比較と行こう。
と言っても、Winの描画性能等比較してもピンと来ないかも知れないのでメモリ速度を測った。
測定に使用したのはNiftyのFEXTでご活躍中の(こじ)さん作によるpfm686だ。
P/I-RP4マザー,マザークロック66.6MHz,クロック倍率3倍=200MHzメモリ:FP16MB SIMM×2枚(インタリーブアクセスは起こらない)
|
ns/dword |
cache read |
4.893 |
cache write |
9.341 |
main read |
30.762 |
main write |
31.933 |
P/I-RP4マザー,マザークロック66.6MHz,クロック倍率3倍=200MHzメモリ:FP16MB SIMM×4枚(インタリーブアクセスとなる)
|
ns/dword |
cache read |
4.865 |
cache write |
9.812 |
main read |
19.346 |
main write |
18.121 |
メモリインタリーブは、遅いメインメモリ(CPUに比較するとDRAMはとても遅いデバイスだ)にアクセスする際に2つのバンクを交互に使用する。
つまり、1.メモリバンク1に読み出しアドレスを与える。
2.メモリバンク2に読み出しアドレスを与える。
3.そんな事をしているうちに、メモリバンク1からデータが出てくる。
4.メモリバンク1に次の読み出しアドレスを与える。
5.メモリバンク2からデータが出てくる...って訳で、待ち時間を有効に使うことが出きるわけだ。
これが、インタリーブでないとメモリバンク2をアクセスするタイミングは待ち時間となるのだ。
もちろん、インタリーブしたからと言ってメモリアクセス時間が半分になるわけではないが、かなりの効果があることが上の測定結果でお解りいただけるだろう。
測定時に使用したSIMMは60nSのアクセス速度のものだが、次に行った80MHzクロックでのテスト時にも安定して動作していた。
CPUの動作クロックが同一なら、マザークロック周波数が高い方がパフォーマンスは向上する。
CPUから見たメモリアクセス速度が速まるからだ。
P/I-RP4マザー,外部クロック80MHz,クロック倍率2.5倍=200MHz,SIMM2枚
|
ns/dword |
cache read |
4.879 |
cache write |
9.813 |
main read |
25.715 |
main write |
26.598 |
P/I-RP4マザー,外部クロック80MHz,クロック倍率2.5倍=200MHz,SIMM4枚
|
ns/dword |
cache read |
4.854 |
cache write |
9.802 |
main read |
16.929 |
main write |
16.637 |
これは結構速い数値だ。
調子に乗って80MHzの3倍速動作も測定してみた。
P/I-RP4マザー,外部クロック80MHz,クロック倍率3倍=240MHz,SIMM2枚
|
ns/dword |
cache read |
4.081 |
cache write |
7.784 |
main read |
25.635 |
main write |
26.610 |
P/I-RP4マザー,外部クロック80MHz,クロック倍率3倍=240MHz,SIMM4枚
|
ns/dword |
cache read |
4.054 |
cache write |
8.176 |
main read |
16.122 |
main write |
15.098 |
P6−200も240MHz程度なら、空冷のみで十分動作する。
次にP/I-P6NP5の測定を行った。
コイツはメモリ性能を要求するため、ウチにある60nS SIMMを4枚挿すとBIOSで最速設定ができなくなる。
DOSで動作させる分には一応動くが、Win95が安定動作するとは言い難い。
メモリインタリーブなしてアクセス速度を上げた代償として、高速なメモリを要求するようだ。
もっとも最近では70nSのSIMMなんてお目にかかれないから、新規購入なら50nS品を2枚で構成すべきだ。
SIMM枚数が増えるとメモリバスの負荷が重くなって、アクセス速度的には不利になる。
測定は、BIOSで自動設定された状態(一番遅くなる模様)と最速に手動設定した場合で行った。
P/I-P6NP5,外部クロック66.6MHz,クロック倍率3倍=200MHz,最遅設定
|
ns/dword |
cache read |
4.912 |
cache write |
9.397 |
main read |
30.546 |
main write |
31.895 |
P/I-P6NP5,外部クロック66.6MHz,クロック倍率3倍=200MHz,最速設定
|
ns/dword |
cache read |
4.893 |
cache write |
9.842 |
main read |
24.790 |
main write |
24.031 |
この値をP6RP4と比較すると、最遅設定のNP5とRP4がほぼ同じくらいのアクセス速度であることが分かる。
(RP4は手動設定項目なし)つまり、最速設定で動作するとすれば(本当は動くはずなんだけど..)インタリーブよりは遅いがそこそこの性能になると言うことが出来るのではないだろうか?
このマザー(NP5)のクロック発生用ICは、50/60/66MHzしか出力設定が出来ない。
従って、80MHzの2.5或いは3倍動作は簡単ではないのだ。
それでも一応..って事で、66.6MHzの3.5倍動作=233MHzで測定してみた。
P/I-P6NP5,外部クロック66.6MHz,クロック倍率3.5倍=233MHz,最遅設定
|
ns/dword |
cache read |
4.223 |
cache write |
8.061 |
main read |
30.546 |
main write |
31.895 |
P/I-P6NP5,外部クロック66.6MHz,クロック倍率3.5倍=233MHz,最速設定
|
ns/dword |
cache read |
4.203 |
cache write |
8.425 |
main read |
23.850 |
main write |
24.028 |
P6NP5のメモリ速度の厳しさだが、EDOを使用することによって多少楽になるかも知れない。
また、未確認ながら同期DRAMも使用できるという噂もある。
では、EDOを使用して実験してみよう。
本当は50nSアクセスタイムのEDOが欲しかったのだが、残念ながら在庫なし。
仕方なく60nS品でテストを行った。
まあ同じチップセットのIntel製マザーを使用したGateWay2000も60nSのメモリだ。
とりあえず32MBのEDO-SIMMを2枚挿入し、BIOSで最速設定後パワーオン。
Win95もちゃんと立ち上がる。
そしてpfmの結果は下記のようになった。
P/I-P6NP5,外部クロック66.6MHz,クロック倍率3.5倍=233MHz,最速設定(EDO)
|
ns/dword |
cache read |
4.891 |
cache write |
9.850 |
main read |
22.948 |
main write |
17.946 |
通常のファーストページRAMより、Writeが速くなっている。
EDOってのは、RAMのデータバス(出力側)にラッチを付けたような構造だ。
簡単に言うと、データがラッチされているから読み込みタイミングが遅くなってもデータが無くならない。
従ってアクセス時間を稼げるって寸法だ。
ただしデータがラッチされているから、インタリーブの方式によってはバスがショートしてしまう。
インタリーブ構成でEDOを使用するためには、各バンクでデータバスを別々に引かなくてはいけない。