AMD Radeon HD6800ドキュメントがリーク – BartsがHD6800シリーズとなる?

vr-zone.com AMD Radeon HD 6800 Document Leaked Published on Friday, October 8 2010 2:59 pm by Sub より。

新たに登場する予定のRadeon HD6800シリーズのPDF概要ドキュメントのスクリーンショットがリークした。出典はIT.com.cnで、Chiphellが掲載した。だけれどもドキュメントは簡体中文であるが、いくつかもの詳細が暴露されている。たとえば命名体系やトレードマークの特徴などが英語で書かれている。予測されるRadeon HD6870の特徴はGDDR5メモリとPCI Express 2.1 x16をサポートし、DirectX11やEyefinityに加え、「EyeSpeed」と呼ばれる機能jが追加されている。UVD3も記載されているが、詳細は中国語である。意外ではないが、AMDはついにnVidia 3DVisionの代替技術を導入している。名前はAMD HD3Dである。そして極めて重要な情報がこの後記載されているが、Barts XTとはAMD Radeon HD6870であり、Barts Proは Radeon HD6850のことである。

噂では長い間Bartsはメインストリーム向けHD5700 Juniperの置換えであり、Caymanが性能重視のCypressの置き換え、dual-Caymanが高性能であるAntillesプロダクトであると信じられていた。これはBartsはHD6700、CaymanはHD6800、AntillesはHD6900であると論理的に導き出された結果である。BartsがHD6700の代わりにHD6800となるとしばらく噂が流れていたが、当初は高性能を重視する消費者によって無視されていた。だけれども、PDFドキュメントが正式なものであると仮定するのなら、もしBartsは実はHD6800であり、CaymanとAntillesはどの位置づけになるのだろう?確かに、CaymanはHD6850/6870になることが出来るが、Antillesについてはどうなるのか?そのスライドはまたAMDの命名他医系に衝いて言及しており、確実な接尾辞は「30」「50」「70」であり、HD6900は不確実である。それに加えこ噂のAntillles Proは事実ではない。そしてもしBartsがHD6800であり、この意味がHD5800より遅いのかかろうじて速いのだろうか?

明らかにいくつかの噂と数多くの相反する情報であり、多くのことが命名体系から推測する必要がある。

加えて、Chiphellの投稿者はHD6800の価格は300ドル未満であると強調している

参考元:Chiphell

AMDの次世代GPUの「Barts」のメモリコントローラについて妄想してみる

semiaccurate.com Northern Islands Barts benefits to moar, bigger? by Stephen Werner September 20, 2010 より。

概要は下記の通り。

  • AMD Radeon HD6770について非常に期待されているが、いったいどのくらいの価格帯なのか?
  • Radeon HD6770もしくは「Barts」は256bitメモリインターフェースと噂されているが従来のRadeonの価格帯では128bitが通例だった。
  • 製造コストを上げてまでAMDは256bitを採用するのか、HD5770「Juniper」の2倍の帯域が必要なのか見ていこう。
  • まずはRadeon HD5770のGPU動作周波数とメモリ周波数を調整する。Crysisと3DMark Vantageの数値から見ていく。実際にはDDR5のECCによる帯域への影響が結果として出るかもしれない。
  • メモリクロックをテストが失敗しない数値まで増加させた。結果数値は動かない。ベンチマークを他の日にもう一度動かしても数値は動かないので結果には自信がある。

Vantageは8.3%のメモリクロックまでで不具合を起こした。 **全体の合計より大きい点に注意

  • これらのテストではAMD PhenomII X4 3.2GHz、4GBメモリ、Windows7 64bitを使い、CPUのボトルネックが発生していないことを似たようなベンチマークを使って確認している。
  • 結果GPUのオーバークロックはメモリのオーバークロックより効果的であり、DDR5のECCによる帯域への結果は出ていない。結果として合計で35%の性能向上ができた。
  • 興味深い点はCrysisのスコアである。GPUとメモリのオーバークロックは個別にオーバークロックしたときの合計よりも性能向上につながる。
  • この結果からHD5770はバランスの良い製品であるという明快な結果が出た。

他のGPUでも試す。

  • HD4890は二つのチップを載せているが、DirectX11対応ではない。もちろんメモリコントローラも既に古い。
  • 理論的にはHD5770とHD4890の間にはメモリ帯域により20%の性能差がある。
  • HD4890をだしたのはメモリコントローラの違いを測定するためではなく、メモリ帯域がHD5770の76.8GB/secに対して124.8GB/secと67%大きい点で比べた。
  • 注意して表の数値を比べてみて欲しい。二つのGPUボードには20%の性能差がある。

  • 興味深い点はHD4890のメモリ帯域により性能が100%拡大しているわけではないところである。それでも30%〜40%の性能向上は見られるのだが、HD4890はHD4870よりメモリは遅い。
  • HD4870はHD5770より50%もメモリ帯域が大きいが、これ以上速いメモリが必要ではない。よってメモリを速くしても少ししか性能は上昇しない。
  • 更にnVidia Geforce 9600GTと9800GTで比較する。両方とも256bitメモリコントローラである。スペックか下記のとおり。

  • 9800GTは9600GTにほとんどの点で優っており、9800GTのテクセルフィルレートや浮動小数点演算能力は9600GTに比べ62%も上である。
  • メモリフィルレートは9800GTと9800GTXはほぼ同じである。
  • 一般的に9800GTは9600GTより15%性能が上であり、その結果メモリの帯域上昇による全体の性能上昇は小さいことがわかる。

メモリ帯域増加によるコスト

  • X-bit labsはRV770のメモリコントローラサイズを4,000万〜4,500万トランジスタと計算している。これはRV770の全体のトランジスタ数の5%未満である。
  • RV770とJuniperは似ている点があり、メモリ帯域が増加することによりトランジスタ数が増加していない点である。
  • この意味はJuniperのメモリコントローラが2,200万トランジスタか全体のトランジスタ数の2%前後であることがわかる。
  • ダイサイズに何が占有しているかはわからないが、一般的なメモリコントローラのトランジスタ密度を知らなくてもある程度のトランジスタ数を見積もることができる。
  • ポイントとして、「メモリコントローラーは128bitと256bitでダイサイズの影響は殆ど無い」ということである。
  • ダイサイズのコストはその大きさが小さくなると歩留まりが少しだけ上がる。もしPCB基板のコストが1層あたり10ドル上がるとした場合、コストの大半はPCB基板が占めるだろう。
  • 9800GTと9600GTを比較することにより、シェーダ数とテクスチャユニット数が性能向上に有効な点がわかる。メモリコントローラを2倍にしてもダイサイズ上では2%〜10%の間に留まるだろう。
  • シェーダ数とテクスチャユニット数の増加は性能向上もあるがダイサイズを大きくしてしまう。だがほとんどのコストを占めるPCB基板のコスト上昇は抑えられる。
  • 数多くの選択肢からどの道を行くのかを決めており、AMDとnVidiaは自身のパートナーの粗利を壊すことなく自身の粗利を確保しているだろう。
  • 歩留まりは予測され決定される必要があり、適切なコストは目標としている性能カテゴリの主要な要素であり、バランスが必要である。

「Barts」は256bitメモリコントローラか否か

  • 「Barts」の競合製品が何であるか思い出すことは非常に重要だ。それはnVidia Geforce 460GTXで、「256bitメモリコントローラ」を持っている。
  • AMDがそのような製品に128bitメモリコントローラを採用した製品で競争することは無いだろう。
  • 「Cayman」シリーズのDDR5メモリコントローラが「Barts」の1,600MHz(x4)であり、25%しかメモリ帯域が大きくない点がそれを示している。
  • もし40%以上のメモリ帯域を上乗せしても全体の性能は10%未満であろう。
  • 256bitメモリコントローラは確かに20%の性能向上をもたらす。
  • ただ確かな点は「Barts」は他のアーキテクチャ改善を行っているだろう。より多くのメモリ帯域は性能向上を提供するが、GPUとメモリクロックを一緒に上昇させたときの素晴らしい性能向上を思い出して欲しい。

最後に誰もが新しいアーキテクチャはダイサイズが小さくなるとメモリ帯域の制限により性能が制限されてしまうだろうと思うが、より大きなメモリコントローラは「Barts」シリーズに性能改善の多大なる貢献をするだろう。

AMDは同意しているかって?あと数週間でわかるよ。

—-

とりあえずスケジュールがHD5000シリーズ時より1ヶ月遅れているようなので2010年10月頃発表・月末販売開始か?

AMDの次世代GPU「Barts XT」のボード画像がリーク – Radeon HD6700かHD6800かそれが問題だ。

AMD Barts XT Pictured Published on Friday, September 10 2010 10:19 pm by Sub より。

AMDの次世代GPU「Barts XT」のボード画像がリーク

今週中頃に、ChiphellのナボレオンはAMDのRadeon HD6000シリーズカードの画像を携えて戻ってきた。今回は「Barts」の番である。噂では大成功したRadeon HD5700シリーズであるという。お願いだから、これはただのエンジニアサンプル品であり、最終製品ボードとは異なることを心に留めておいて欲しい。それはまた隙間が多すぎてメモリなどすべてを冷やすことのできないGPUクーラーが物語っている。

最終製品バージョンのクーラーはPCB上に搭載され、それはデュアルスロットタイプであろう。そのカードは二つのDVI端子、一つのHDMI端子、そして二つのDisplayPort端子の様に見える端子軍が特徴である。「Barts XT」は二つの6ピンPCI-Express電源コネクタを搭載し、消費電力はおよそ150W前後であると示唆している。もちろん、二つの6ピン電源コネクタはテスト目的のただのプロトタイプであるという可能性もあり、最終製品カードではRadeon HD5770の様に多分たった1つの6ピン電源コネクタのみになるだろう。そのカードはHD5770よりも長く、HD5850に近い長さである。噂の256bitメモリインターフェースが有効なように見える。

カード裏はダイサイズが「Juniper」よりも大きいことを示唆している。それらの全てが示唆していることは、「Barts XT」がRadeon HD5770よりも確実に性能が向上しており、これは「Barts」がRadeon HD6700シリーズではなくHD6800シリーズとして発表されるだろうということだ。だけれども一つのミッシングリンクが存在する。それはCrosFireコネクタである。HDx8xxシリーズとは異なり、「Barts」は2つのGPUをCrossFireで接続するための一つのCrossFireコネクタしか備えていないという点である。

ソース元では、最終的な「Barts」カードは一般向けの製品として投入されるだろうと言及している。かれらはそれがRadeon HD6700シリーズかHD6800シリーズでブランディングされるかどうか含みを残しているように見える。確実に言えることは、Radeon HD6000シリーズはHD5000シリーズから少しだけ再設計されているだろうということである。

参照元 : TechPowerUp

—-

見た目もいかにもエンジニアリングサンプル品らしいボードだな。

うわさ AMDのノートPC向け次世代GPU「Blackcomb」はMobility Radeon HD6000シリーズのフラッグシップか?

vr-zone.com [Rumour] “Blackcomb” is AMD Mobility Radeon HD 6000 Series Flagship Published on Sunday, September 5 2010 1:18 am by Sub より。

DonanimhaberはAMD Mobility Radeon HD6000シリーズのコードネーム「Blackcomb」が陣頭を取るだろうというレポートを発表した。もちろん、「Blackcomb」はデスクトップ向けのチップベースで、おそらく「Barts」か「Cayman」のどちらかだろう。AMDはMobility Radeon HD5000シリーズには「Cypress」を完全にスキップし、Mobility Radeon HD5870には800SPで128bitメモリインターフェースの「Juniper」を充てている。「Blackcomb」は256bitメモリインターフェースが特徴だが、いくつかの機能ユニットが劇的に増加していると予測される。

これは「Blackcomb」が「Cayman」チップに似ているという必要性に意味はなく、おそらくいまだ「Barts」ベースであろう。だけれども、Radeon HD6700の性能を有する「Barts」は256bitメモリインターフェースを特徴とする噂があり、それはHDx700とHDx800の性能ギャップを埋めることになるだろう。それ故我々は「Juniper」が「Cypress」との差よりも「Barts」と「Cayman」との差はより小さいと予測することが可能である。

Mobility Radeon HD6000シリーズは結果として、シリーズ全体の性能を劇的に向上している。だけれどもノートPC向けGPUとして性能が常に制限をかけられる要因があり、私達は新しい製品がMobility Radeon HD5870よりも高い速度であると予測できない。だけれども未だに性能の大幅な工場になることは疑いようがないだろう。しれはまたUVD3やEyefinityを特徴としている。nVidiaは新しくアナウンスしたノートPC向けGeforce 400M製品群ではOptimus技術(GPUを動的に切り替えて消費電力や発熱量を抑える技術)や3D Visionを強くプッシュしており、AMDは競合技術を回答として発表するだろう。

参照元 : Donanimhaber

—-

ノート向けGPUにも劇的な性能向上の兆しが出てきているな。ノートPCが販売の主流の日本では流行るかもしれない。

nVidia GTX460のダイサイズとFermiアーキテクチャの失敗

SemiAccurate GF104/GTX460 has a huge die Economics of a failed architecture by Charlie Demerjian より。

GF104/GTX460は巨大なダイ

失敗したアーキテクチャの経済状態

nVidiaのFermiアーキテクチャは失敗したと私たちが言ったとき、ほとんどの人々は私たちがFermiアーキテクチャに焦点を当てていることの意味することを理解しなかった。GTX460のリリースと共にダイサイズの問題に明確に焦点を当てていて、それはnVidiaにとって全く持って厄介なことであるように見える。

もしあなたが思い出せるのなら、他の誰よりも確かな情報が出る数カ月前に私たちはGF100は529mm^2の巨大なチップであることを最初に伝えた。これはEXPreviewのいくつかの写真により8ヶ月前にバックアップされたものだ。私たちは今あなたにGF104ダイについてそれは24.9mm×14.7mmの大きさで、ダイサイズは367mm^2であることを伝えた(このサイズは小数点を正確な数値に丸めたものである。それらはあなたが366m^2と乗算した数字より髪の毛ほど大きいが、これは間違いではない)。367mm^2という数値はダイを直接測定した幾人かのマッドサイエンティスト達が出した正確なものである。いくつかの奇妙な理由のために、nVidiaはいかなるダイサイズの数値について口に出さなかった。GTX460のレビューが掲載される前に人々にいつくかの知られたくなかった役割を果たすかのようにダイサイズのあらゆる数値を話そうとしなかった。

最も友好的なサイトの発表した正確な数値はTechReportの320mm^2であった。その為にスコット・ワッソンは、Comptex後の私の旅行かばん内で転がりまくったほとんど割れない個別包装されたKit-Katスティックに勝利した。ワッソン氏に私からあなたが賞賛されたIDFについて祝福の言葉を贈ろう。誰もGF104のサイズが最も近いライバルであるAMDのCypress/HD5800シリーズより大きいとは話さず、nVidiaはあなたにそれを知られたくなかった。

この問題はnVidiaにとってシンプルである。このパーツの収益は良くない上に基本的なアーキテクチャが悪くてその結果として出来たパーツで困難な戦いを始める。これはnVidiaにとっての問題であり、エンドユーザの問題ではない。もしGTX460が途方に暮れる値づけをされるのなら、消費者は気にもかけることなく、nVidiaはひどい仕打ちを受けそれで終了する。小売業者はパーツの製造会社のための利益についてほとんど気にしない。

Cypress/HD5800は334mm^2のサイズでGF104より10%ほど大きい。もし歩留まりが両パーツとも同じならGF104がCypressを作るより10%かそれ以上のコストが発生することを意味する。複数の半導体製造関連のソースは、SemiaccurateにGF104はCypressの歩留まりに全く及ばないと伝えている。

愉快な側面として、GF104とCypressの両チップは同じ製造プロセスで作られており、TSMCの40nmプロセスというそっくりそのまま同じ工場内である。AMDは21億5千万トランジスタ、1平方mmあたりおよそ644万トランジスタを334mm^2内に詰め込むことを成し遂げている。GF104は19億5千万トランジスタ、1平方mmあたり531万トランジスタを367mm^2内に内包している。この意味はAMDのEvergreenアーキテクチャがGF104に比べて20%以上も効率的であり、より多くの性能と非常に大きなワットパフォーマンス(消費電力あたりの性能)を提供する。SemiAccurteがNvidiaのレイアウト・物理設計チームをからかう時、ちゃんと理由がある。

話の流れを元に戻すが、Cypressは現在HD5870とHD5850を組み合わせた歩留まり率は75%であり、もしHD5830を加えるのなら更に上昇するであろう。GF104は7つのシェーダーグループの一つと336SPが使えなくして歩留まり率を上昇させている。それが歩留まり率を60%以上超えることができない理由となっている。もしnVidiaがより多くのGF104から派生した製品のリリースを決定するとき、歩留まり率が上昇する影響を与えるだけでなく、Juniperチップ(HD5700シリーズ)に対して性能上昇はどうしても低くなる。これは経済的な自殺行為である。

GF140は300mmシリコンウエハー一枚あたりおよそ150個取れることを意味し、歩留まり率60%を入れると約90個の良いパーツが取れることになる。Cypressはおよそ160個であり、歩留まり率70%を入れるとシリコンウエハー一枚あたり120個の良いパーツが取れることになる。あなたは自分の隙なように数字をいじって遊ぶことができるが、例としてデビッド・モーガンが行なった結果があるが、Cypressは公式発表に比べ小さいサイズで著しく歩留まり率が良い事実がわかる。

もしTSMCの40nmシリコンウエハーが1枚5000ドルとしたら、それはHD5850やHD5870を作るのにAMDはおよそ42ドルという良い結果を意味する。対してnVidiaにとって良い状態のGF104のコストは56ドルである。もしそれらにHD5830を加えるとしたらAMDはより低いコストとなり、nVidiaがGF104の様々な派生物を提供し続けることに真実味を持たせることを意味する。これは結局巻き込まれる問題の理由だが、nVidiaにとっては終わりではない。

HD5870やHD5850のベースであるCypressカードは、GTX460のベースであるGF104カードを768MB版を199ドル、1GB版を229ドルで販売する間におよそ380ドル〜300ドルで販売されているように見える。もしカードがHD8350のようなCypressのカードがnVidiaのローエンドカード帯に割り込んで市場に提供されると、それらはHD5850の価格と性能に従うであろう。

GPUの価格に戻ってみると、あなたはnVidiaのシリコンコンポーネントのコストがAMDのそれに比べておよそ25%以上高いことを思い出すだろう。そしてその結果カードはAMDが販売してる価格の63%で販売することになる。あなたはそれらすべてが存在するとして利潤を絞りだせるということができるだろうか?AMDは小売価格を100ドル下げることが可能であり、nVidiaが現在GF104を作るよりもより多くの利益を得ることができる。

nVidiaはAMDの思惑の中でのみGF104から幾らかの利益を得られるだろう。なぜならCypressは現在供給量を抑制されており、TSMCは40nmシリコンウエアーが十分行き渡るまで作ることができないからだ。GF104/GTX460は現在のシリコンウエハー供給可能量により依存しているCypressからAMDのマーケットシェアを効果的に十分に奪うべきであるが、AMDは価格を下げてGF104の売上を赤字に追いやるのが適当であろう。そこで「AMDはできるのか?」という疑問ではなく、「彼らはそれをやるであろうか」という疑問である。

もしあなたがAMDだとしてよりよくローエンドのHD5830カードを供給を増やすのなら、歩留まり率の向上が影響するためASP(平均小売単価)は下がるだろう。もしnVidiaが8クラスタ中6クラスタがアクティブにされたより低いスペックのGF104を提供するのなら、歩留まり率は向上するが、平均小売単価は大幅に下がるだろう。そのローエンドカードは大きさ166mm^2でCpyressチップの半分以下のコストで生産可能なAMDのJuniperチップと競合するだろう。もう一度言おう、nVidiaは根本的に壊れているGF104アーキテクチャのために銃撃戦をナイフで戦おうとしている。

もしnVidiaが8クラスタすべてが動作するハイスペックのGF104を提供するのなら、それらは平均小売単価を上昇させる可能性があるが、実行するには歩留まり率はとんでもなくボコボコになるだろう。これは頭の悪い野次馬にはよく磨かれた光の輪のようによく見えるだろうが、それは経営状況をより良くなるかは疑わしい。

最後に、GF104/GTX460は消費者にとって適正な価格でAMDのラインナップの穴を埋める良いカードである。その穴はAMDの最低ラインよりも良いものの為のに存在する。nVidiaはGTX460で寝ているライオンをつつき起こした。そしてそれを実行し緑色のチーム(AMD)から何の防御もなしに叩かれてしまうことを決定した。

この問題は一層悪いことに、Fermiアーキテクチャはただ設計が悪いだけでなく四半期もの遅れを招いた。nVidiaが近づきつつあるGF106やGF108の派生物と一緒にGF10xラインを一新しようとするとき、AMDは彼らが「Southern Islands」と読んでいる次世代チップが登場する。

それはAMDの現在のパーツを一気に価格を下げるだろうが、経営的にはnVidiaにはどこにも逃げる場所がない。最も良い場合で、nVidiaにはハンマーをうち下ろす前の数ヶ月の糸口がある。その間に緑色の少年たち(AMDの技術者)は眠っているライオンを突つき起こさずハンマーを素早く振り下ろして注意深く実行すべきである。彼らがそれを行うことは何の問題もないが、nVidiaは軽くなぎ払われてしまうだろう。

長いな、おい。nVidiaにとって最悪なことは財政ではなくAMDに比べて製品供給サイクルが1周以上開いてしまうということか。あとCharlieはしっかりnVidiaをからかっていると明言したw

直訳で読みにくくてすみません。間違いがあれば指摘してもらえると助かります。