AMDの次世代GPUの「Barts」のメモリコントローラについて妄想してみる

semiaccurate.com Northern Islands Barts benefits to moar, bigger? by Stephen Werner September 20, 2010 より。

概要は下記の通り。

  • AMD Radeon HD6770について非常に期待されているが、いったいどのくらいの価格帯なのか?
  • Radeon HD6770もしくは「Barts」は256bitメモリインターフェースと噂されているが従来のRadeonの価格帯では128bitが通例だった。
  • 製造コストを上げてまでAMDは256bitを採用するのか、HD5770「Juniper」の2倍の帯域が必要なのか見ていこう。
  • まずはRadeon HD5770のGPU動作周波数とメモリ周波数を調整する。Crysisと3DMark Vantageの数値から見ていく。実際にはDDR5のECCによる帯域への影響が結果として出るかもしれない。
  • メモリクロックをテストが失敗しない数値まで増加させた。結果数値は動かない。ベンチマークを他の日にもう一度動かしても数値は動かないので結果には自信がある。

Vantageは8.3%のメモリクロックまでで不具合を起こした。 **全体の合計より大きい点に注意

  • これらのテストではAMD PhenomII X4 3.2GHz、4GBメモリ、Windows7 64bitを使い、CPUのボトルネックが発生していないことを似たようなベンチマークを使って確認している。
  • 結果GPUのオーバークロックはメモリのオーバークロックより効果的であり、DDR5のECCによる帯域への結果は出ていない。結果として合計で35%の性能向上ができた。
  • 興味深い点はCrysisのスコアである。GPUとメモリのオーバークロックは個別にオーバークロックしたときの合計よりも性能向上につながる。
  • この結果からHD5770はバランスの良い製品であるという明快な結果が出た。

他のGPUでも試す。

  • HD4890は二つのチップを載せているが、DirectX11対応ではない。もちろんメモリコントローラも既に古い。
  • 理論的にはHD5770とHD4890の間にはメモリ帯域により20%の性能差がある。
  • HD4890をだしたのはメモリコントローラの違いを測定するためではなく、メモリ帯域がHD5770の76.8GB/secに対して124.8GB/secと67%大きい点で比べた。
  • 注意して表の数値を比べてみて欲しい。二つのGPUボードには20%の性能差がある。

  • 興味深い点はHD4890のメモリ帯域により性能が100%拡大しているわけではないところである。それでも30%〜40%の性能向上は見られるのだが、HD4890はHD4870よりメモリは遅い。
  • HD4870はHD5770より50%もメモリ帯域が大きいが、これ以上速いメモリが必要ではない。よってメモリを速くしても少ししか性能は上昇しない。
  • 更にnVidia Geforce 9600GTと9800GTで比較する。両方とも256bitメモリコントローラである。スペックか下記のとおり。

  • 9800GTは9600GTにほとんどの点で優っており、9800GTのテクセルフィルレートや浮動小数点演算能力は9600GTに比べ62%も上である。
  • メモリフィルレートは9800GTと9800GTXはほぼ同じである。
  • 一般的に9800GTは9600GTより15%性能が上であり、その結果メモリの帯域上昇による全体の性能上昇は小さいことがわかる。

メモリ帯域増加によるコスト

  • X-bit labsはRV770のメモリコントローラサイズを4,000万〜4,500万トランジスタと計算している。これはRV770の全体のトランジスタ数の5%未満である。
  • RV770とJuniperは似ている点があり、メモリ帯域が増加することによりトランジスタ数が増加していない点である。
  • この意味はJuniperのメモリコントローラが2,200万トランジスタか全体のトランジスタ数の2%前後であることがわかる。
  • ダイサイズに何が占有しているかはわからないが、一般的なメモリコントローラのトランジスタ密度を知らなくてもある程度のトランジスタ数を見積もることができる。
  • ポイントとして、「メモリコントローラーは128bitと256bitでダイサイズの影響は殆ど無い」ということである。
  • ダイサイズのコストはその大きさが小さくなると歩留まりが少しだけ上がる。もしPCB基板のコストが1層あたり10ドル上がるとした場合、コストの大半はPCB基板が占めるだろう。
  • 9800GTと9600GTを比較することにより、シェーダ数とテクスチャユニット数が性能向上に有効な点がわかる。メモリコントローラを2倍にしてもダイサイズ上では2%〜10%の間に留まるだろう。
  • シェーダ数とテクスチャユニット数の増加は性能向上もあるがダイサイズを大きくしてしまう。だがほとんどのコストを占めるPCB基板のコスト上昇は抑えられる。
  • 数多くの選択肢からどの道を行くのかを決めており、AMDとnVidiaは自身のパートナーの粗利を壊すことなく自身の粗利を確保しているだろう。
  • 歩留まりは予測され決定される必要があり、適切なコストは目標としている性能カテゴリの主要な要素であり、バランスが必要である。

「Barts」は256bitメモリコントローラか否か

  • 「Barts」の競合製品が何であるか思い出すことは非常に重要だ。それはnVidia Geforce 460GTXで、「256bitメモリコントローラ」を持っている。
  • AMDがそのような製品に128bitメモリコントローラを採用した製品で競争することは無いだろう。
  • 「Cayman」シリーズのDDR5メモリコントローラが「Barts」の1,600MHz(x4)であり、25%しかメモリ帯域が大きくない点がそれを示している。
  • もし40%以上のメモリ帯域を上乗せしても全体の性能は10%未満であろう。
  • 256bitメモリコントローラは確かに20%の性能向上をもたらす。
  • ただ確かな点は「Barts」は他のアーキテクチャ改善を行っているだろう。より多くのメモリ帯域は性能向上を提供するが、GPUとメモリクロックを一緒に上昇させたときの素晴らしい性能向上を思い出して欲しい。

最後に誰もが新しいアーキテクチャはダイサイズが小さくなるとメモリ帯域の制限により性能が制限されてしまうだろうと思うが、より大きなメモリコントローラは「Barts」シリーズに性能改善の多大なる貢献をするだろう。

AMDは同意しているかって?あと数週間でわかるよ。

—-

とりあえずスケジュールがHD5000シリーズ時より1ヶ月遅れているようなので2010年10月頃発表・月末販売開始か?

広告
コメントする

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。