NVIDIAのProject Denverのファーストシリコンは8コアARM、256CUDAコアのAPU?

1st Silicon with NVIDIA Project Denver is an 8-Core ARM, 256 CUDA Core APU? 7/18/2011 by: Theo Valich – Get more from this author より。

NVIDIAのProject Denverのファーストシリコンは8コアARM、256CUDAコアのAPU?

複数のニュースソースから聞いた情報によると、NVIDIAは最近コードネーム「Project Denver」のSoCである最初の「CPU」を目標とした設計を公開し展開を始めた。

私達が入手した情報は、プロジェクトデンバーCPUコアが「T40 – Tegra4 (Wayne)」に非常に似ているように見える。内部スケジュールによると、Wayneのシリコンは今後2週間以内にテープアウトする予定であり、ディベロッパーはそれらのプロトタイプシリコンを2011年12月に手に取ることができるとしている。Wayneシリコンは4つ以上のARMコアから成り立っており(NVIDIAはコアのタイプを公開しておらず、ふざけてて言うならA15かPDであろう)、64個以上のGPUコアを含む。

同じ2011年12月の間に、NVIDIAはProject Dennverをベースにしたファーストシリコンをテープアウトする予定である。それらは8コア以上のNVIDIAカスタムの64bit ARM CPUにGeForce 600クラスのGPUを組み合わせた物である。NVIDIAはCPUの開発に数多くの問題を抱え、一般的な意見としてはNVIDIAはシングルの28nm PD CPU設計と28nm Fermiベースの設計を細葉した慎重なアプローチを取るだろうと言われている。 言い換えれば、ノートPC・ローエンドデスクトップPC向け GeForce 600シリーズカード(「GeForce300」を思い出す?)にリフレッシュしたFermiベースの設計であると噂されてる。

他のニュースソースによるとこのニュースの題名のとおり、シリコンのGPU部分は「少なくとも256 CUDAコア」で、「Northern Islands」とBulldozer拡張CPUを組み合わせたAMDのTrinity APUを目標としているとのこと。VLIW4アーキテクチャとAMDのキーとなるAPUは2012年に登場する予定である。計算処理能力を拡張するため、NVIDIAは天国に登るような高い動作クロックを求めず、それぞれIPC(クロックあたりの処理可能な命令数)の向上を可能な限り高めることを求めている。まだその製品は現実的には2.0-2.5GHzでCPUやGPUが動作するだろうと予測されており、メモリーコントローラーとシリコンの残りの部分はより低い比率のクロックのまま動作すると予測されている。

AMDのAPU設計と異なり、CPUとGPUパーツはDDR3メモリの速度で動作するメモリコントローラにより接続されており、Project DenverはCPUとGPUがより緊密に通信可能な方法を模索しており、言い換えれば最も良いGPU設計は広帯域な接続により実現できるということである。NVIDIAはL1、L2、L3キャッシュの設計を従来通りでは設計せず、GPU部分がキャッシュメモリと1TB/sec以上のコネクションを持っており、噂にあったDenverコア設計と非常に良く似たアプローチをとっている。GPU部分同様に、メモリコントローラーはシリコンダイ面積をとっており、CUDAコアはCPUコアと接続されCPUは接続帯域の要求に対し優先してアクセスできる。

だけれどもNVIDIAはCPUに必要な全帯域の10-20%のみを必要としており、GPUは引き続きシステムメモリが充てられるだろう。

またノートPCやデスクトップ、サーバーのマザーボード設計が進行中で、PCI Express 3.0はメインコネクションの特徴であるとうたわれており、USB3.0やSATA 5GBpsが同時に接続される。これらの与えられた情報によると、NVIDIAは残りの全ての前線に攻撃を仕掛けるようだ。軽量ノートPC分野には低スケールTegra3と4(スマートフォン/タブレット/ネットブック)を割り当て、よりパワフルなシリコンは軽量ノートPCやデスクトップに使われ、サーバー分野にはより興味深い戦略で望むのだろう。

一方、PD CPUの1世代に、NVIDIAはパワフルなGPUを武器にブレードサーバ市場に算入することを望んでいるが、また一方でNVIDIAはTeslaのビジネスでIntelやAMDのx86コアへの依存を排除したがっている(一つのTeslaGPGPUは一つの- XeonかOpteron -が要求される)。それらが等しくx86からの脱却は確実に利益を多く見せるだろうが、一方でAMDとIntelは頭から足の先まで同じシリコンを使ったデスクトップ・ノートPCで利益を充填し楽しんでいる。

広告

nVidiaはCUDAのx86アーキテクチャへの最適化にほとんど興味がない – アナリスト談

xbitlabs.com Nvidia Hardly Interested in Optimal Performance of CUDA on x86 Processors – Analyst. Despite CUDA x86 Cross-Compiler, Life of Programmers Will Not Get Easier [09/28/2010 07:49 PM] by Anton Shilov より。

nVidiaはCUDAのx86アーキテクチャへの最適化にほとんど興味がない – アナリスト談

CUDAのx86向けクロスコンパイラに反して、プログラマの生活はより良くはならないだろう。
Anton Shilov
2010年9月28日

nVidiaとPortland Groupは先週nVidia CUDAアーキテクチャからx86へ、又は逆にx86からCUDAへソフトウエアを開発することができる特別なコンパイラを登場させた。これはソフトウエア開発者が彼らのプログラムに広く互換性を保証し、高並列GPUアーキテクチャを活用できることを提案している。だけれども、ソフトウエアメーカの生活はより良くなることはないだろうと、Jon Peddie ResearchのAlex Herreraは語った。

異なるアプリケーションのため、これらにはスーパーコンピュータ分野も含まれるが、より高い性能を照らす光明があるにもかかわらずATI RadeonやnVidia Geforceのようなグラフィクスプロセッサのために作り直されることはない多くの理由がある。主な理由の一つは、これまでも使われているレガシーなコードがあり、既に業務で使用されているためほとんどど捨てることができない。コンパイラはPGIとnVidiaが共同でソフトウエア開発者にCUDAベースのソフトウエアをx86プラットフォームにアプローチすることでテストしてもらいたがっており、信頼度を測ってもらいたがっている。それにもかかわらず、十分に安定して動作しているが、CUDAベースのソフトウエアのx86アーキテクチャでの性能はほとんど最適化されていない、とHerrera氏は主張している。

GPUベースのnVidia PhysXがそうであるようにCUDAもまたSSE2等のSIMDインストラクションをサポートしていない。新しいコンパイラはAMD BulldozerやIntel Sandy Bridgeマイクロプロセッサで使われる予定のAVXのようなものもサポートしないだろう。その結果、アプリケーションソフトウエアはx86プラットフォームでは最高性能を発揮できないだろ。

「x86で動作するCUDAはCUDAを使用しないでx86アーキテクチャに最適化されたアプリケーションソフトより遅くなるだろう。そしてx86で動作するCUDAアプリケーションやFermiで動作するアプリケーションを動作させる開発者は、最初に簡便に最適化できるCUDA無しのx86プラットフォームのほうが他のCUDAベースのアプリケーションよりも速く動作するのを目撃するだろう。より大きな性能向上によるベンチマーク数値はnVidiaが多くの浮動小数点演算を多用するアプリケーションソフトウエアでCPUよりもGPUのほうがより速いと宣伝する目的で使用されるだろう。」とアナリストは語った。

最後に、特定の目的および一般向け商用ソフトウエアの設計者は異なるハードウエアのために異なるコードを実装する必要が出てくるだろうし、いくつかは既に行われている。


開発側の負担が大きくなるだけで誰も得をしないということだな、nVidiaのCUDAは。あくまでも宣伝用でしか無いと。

AMDの次世代GPU Radeon HD6000シリーズのローンチが遅延し、その間にnVidiaはGPU価格を更に下げる

digitimes.com AMD to delay the launch of Radeon HD 6000 series, while Nvidia drops GPU price Monica Chen, Taipei; Joseph Tsai, DIGITIMES [Tuesday 28 September 2010] より。

AMDは次世代GPUであるRadeon HD6000シリーズ(Southern Islands)のローンチスケジュールを当初の2010年10月12日から11月に延期したとの情報がグラフィクスカード市場から伝えられた。

複数のニュースソースは、このチャンスを捉えてnVidiaは新しいエントリー向けGPUを10月に既存のGPU価格より切り下げてローンチし市場シェアを取り戻す意向である。

AMDとnVidiaの双方は自身のGPU製品のローンチスケジュールについてコメントを拒否している。

TSMCがGPU向け32nmプロセスのR&Dをスキップし、直接28nmプロセスのR&Dを行うため、AMDは自身の計画を修正し新しいRadeon HD6000シリーズを40nmに合わせて継続することを決定した。だがそのため新GPUの構造とプロセスは既存のHD5000シリーズに近いと市場関係者は新製品は少し保守的な製品になると語っている。

その反応に対し、nVidiaは新しいエントリー向けGPUであるGeforce GT430を10月にローンチする計画であり、Geforce GT220およびGTX460 768MBグラフィクスカードの価格を切り下げることにした。

—-
nVidiaは誰得なGPUカードの価格を下げるんだなw

更新2010年10月2日

dititimesから記事が。2010年10月19日台湾で開催されるAMD’s Technical Forum and Exhibition 2010 でRadeon HD6000シリーズが公開されるとのこと。ここの記事はなんか玉石の差が大きすぎるな。

nVidia CEOがFermi出荷遅延について問題点を率直に語る

hexus.net NVIDIA explains initial Fermi delays より。

nVidiaのJen-Hsun Huangが最新GPUの出荷の遅れを引き起した原因について驚くほど率直なインタビューでいくつか説明してくれた。

インタビューと動画撮影をしたジャーナリストはGolem.deである。huangは、会社は設計図は現実に可能であることと必ずしも調和しないということを気付かされたと説明した。Fermiアーキテクチャの製造で生じた問題は、それそれが相互接続インターフェース群を経由して接続されている複数のストリーミングプロセッサ(SM)クラスタが壊れてしまったことである。

Huangはこれらの相互接続インターフェース群は密度が高くきつく束ねられた織物の繊維のようであると説明した。設計上では、相互接続インターフェースはそれぞれの演算コアとチップのそれ以外の部分とが非常に高速に通信できるようにされていた。だが実際には計画とは全く異なった。

最初のサンプルがTSMCから受け取ったとき、全てのSM群は正常に動作しているように見えたが、他のSMとの通信が全くできなかった。一見したところ相互接続インターフェースは、信号がそれぞれ干渉しあい、完全に通信ができなかった。それはチップ内で情報を伝えることができない交通渋滞のようなものである。

Huangはそれを「設計とツール及び現実との間が完全に壊れてしまった状態」と語った。その問題は製造エンジニアと設計エンジニアがそれぞれ別の部門に所属していたために発生した。その問題自身は解決はそんなに難しいわけではないが、経営管理者によって問題に対する解決の指示を部門に割り当てなかった為、その問題は中に浮いたままになってしまった。結果として動作しないチップを再設計しなおす必要になり、最初のFermiアーキテクチャグラフィクスカードのローンチ遅延を引き起した。

これは単純な懺悔だが、特に経営層にとって会社が間違いを広く認めているように見えることは元気づけられる。そしてそれらの問題から前進することを学ぶことを願うばかりである。

—-

えっと、製造プロセスと設計に問題があって、組織上の問題が重なって製品が遅延したということか?
その間AMDはTSMCで改善に取り組んでいたわけだし、同じ製造会社で問題を回避しHD5000シリーズは大ヒットしたんだよな。
…問題は経営者か。

nVidiaの次世代GPU「Kepler」は2011年第2四半期に登場予定

vr-zone.com NVIDIA next-gen is “Kepler”, 28nm in H2 2011 Published on Wednesday, September 22 2010 5:17 am by Sub より。

nVidiaの次世代GPU「Kepler」は2011年第2四半期に登場予定

GTC2010開催中に、nVidiaは現在呼ばれている次世代GPUアーキテクチャ名「Kepler」を公開した。nVIdiaは未だに「Fermi」シリーズの最後のチップである「GF108」を2010年10月にGeforce GT400リリースして製品ラインナップを補間するのに忙しい。次の大きなステップはたった2011年第2四半期に「Kepler」と共に進むという。

「Kelper」はワットあたりの倍精度性能を「Fermi」の2倍〜3倍の向上を目指している。不運にもGTCは伝統的にゲームよりもコンピューティングに重きを置くが、倍精度演算はゲームにとっては少なくとも現時点ではあまり重要ではない。ゲームに関連する様々な大きな革新は将来開示されると考えることが適切だろう。「Kepler」と共にやってくる「Maxwell」は、相当なワットあたりの倍精度演算性能の改善を約束しているが、nVidiaの科学者の名前をアーキテクチャ名にする流れは2013年および22nmまで続くだろう。

2011年第2四半期の「Kepler」および2013年の「Maxwell」のスケジュールが公開されている間、nVidiaもTSMCも目標日程に合わせるために必要な工程全てに成功しているわけではなく、我々はこれらの日程を割り引いて捉えるだろう。特にかつて「Fermi」が同じスライドに2009年の日程が書かれており、実際には一番早く「Fermi」カードが登場したときは2010年4月しか可能ではなかったことを考えると現実には目標日程は割り引いておくことが妥当であろう。たとえそうでも、2011年第2四半期はかなり遅い時期であり、私たちはAMD HD6000世代との戦いの前に幾らかの蓄えを持っておくことを願うばかりである。

参照元:Fudzilla

—-

ちなみに「Kepler」(ヨハネス・ケプラー)は、17世紀現在のチェコ共和国にてプラハでティコ・ブラーエの膨大な天体観測結果から、コペルニクスの地動説の問題を解決し惑星運動の3大法則を発見した偉人。
「Maxwell」(ジェームズ・クラーク・マックスウェル)はアンペール・マックスウェルの法則(変位電流と磁場の関係)およびマックスウェル方程式で電気と磁気を統一する電磁気学を創設した偉人。
さてnVidiaはこれらの偉人の名前を傷をつけない製品を開発できるのか?

AMDの次世代GPUの「Barts」のメモリコントローラについて妄想してみる

semiaccurate.com Northern Islands Barts benefits to moar, bigger? by Stephen Werner September 20, 2010 より。

概要は下記の通り。

  • AMD Radeon HD6770について非常に期待されているが、いったいどのくらいの価格帯なのか?
  • Radeon HD6770もしくは「Barts」は256bitメモリインターフェースと噂されているが従来のRadeonの価格帯では128bitが通例だった。
  • 製造コストを上げてまでAMDは256bitを採用するのか、HD5770「Juniper」の2倍の帯域が必要なのか見ていこう。
  • まずはRadeon HD5770のGPU動作周波数とメモリ周波数を調整する。Crysisと3DMark Vantageの数値から見ていく。実際にはDDR5のECCによる帯域への影響が結果として出るかもしれない。
  • メモリクロックをテストが失敗しない数値まで増加させた。結果数値は動かない。ベンチマークを他の日にもう一度動かしても数値は動かないので結果には自信がある。

Vantageは8.3%のメモリクロックまでで不具合を起こした。 **全体の合計より大きい点に注意

  • これらのテストではAMD PhenomII X4 3.2GHz、4GBメモリ、Windows7 64bitを使い、CPUのボトルネックが発生していないことを似たようなベンチマークを使って確認している。
  • 結果GPUのオーバークロックはメモリのオーバークロックより効果的であり、DDR5のECCによる帯域への結果は出ていない。結果として合計で35%の性能向上ができた。
  • 興味深い点はCrysisのスコアである。GPUとメモリのオーバークロックは個別にオーバークロックしたときの合計よりも性能向上につながる。
  • この結果からHD5770はバランスの良い製品であるという明快な結果が出た。

他のGPUでも試す。

  • HD4890は二つのチップを載せているが、DirectX11対応ではない。もちろんメモリコントローラも既に古い。
  • 理論的にはHD5770とHD4890の間にはメモリ帯域により20%の性能差がある。
  • HD4890をだしたのはメモリコントローラの違いを測定するためではなく、メモリ帯域がHD5770の76.8GB/secに対して124.8GB/secと67%大きい点で比べた。
  • 注意して表の数値を比べてみて欲しい。二つのGPUボードには20%の性能差がある。

  • 興味深い点はHD4890のメモリ帯域により性能が100%拡大しているわけではないところである。それでも30%〜40%の性能向上は見られるのだが、HD4890はHD4870よりメモリは遅い。
  • HD4870はHD5770より50%もメモリ帯域が大きいが、これ以上速いメモリが必要ではない。よってメモリを速くしても少ししか性能は上昇しない。
  • 更にnVidia Geforce 9600GTと9800GTで比較する。両方とも256bitメモリコントローラである。スペックか下記のとおり。

  • 9800GTは9600GTにほとんどの点で優っており、9800GTのテクセルフィルレートや浮動小数点演算能力は9600GTに比べ62%も上である。
  • メモリフィルレートは9800GTと9800GTXはほぼ同じである。
  • 一般的に9800GTは9600GTより15%性能が上であり、その結果メモリの帯域上昇による全体の性能上昇は小さいことがわかる。

メモリ帯域増加によるコスト

  • X-bit labsはRV770のメモリコントローラサイズを4,000万〜4,500万トランジスタと計算している。これはRV770の全体のトランジスタ数の5%未満である。
  • RV770とJuniperは似ている点があり、メモリ帯域が増加することによりトランジスタ数が増加していない点である。
  • この意味はJuniperのメモリコントローラが2,200万トランジスタか全体のトランジスタ数の2%前後であることがわかる。
  • ダイサイズに何が占有しているかはわからないが、一般的なメモリコントローラのトランジスタ密度を知らなくてもある程度のトランジスタ数を見積もることができる。
  • ポイントとして、「メモリコントローラーは128bitと256bitでダイサイズの影響は殆ど無い」ということである。
  • ダイサイズのコストはその大きさが小さくなると歩留まりが少しだけ上がる。もしPCB基板のコストが1層あたり10ドル上がるとした場合、コストの大半はPCB基板が占めるだろう。
  • 9800GTと9600GTを比較することにより、シェーダ数とテクスチャユニット数が性能向上に有効な点がわかる。メモリコントローラを2倍にしてもダイサイズ上では2%〜10%の間に留まるだろう。
  • シェーダ数とテクスチャユニット数の増加は性能向上もあるがダイサイズを大きくしてしまう。だがほとんどのコストを占めるPCB基板のコスト上昇は抑えられる。
  • 数多くの選択肢からどの道を行くのかを決めており、AMDとnVidiaは自身のパートナーの粗利を壊すことなく自身の粗利を確保しているだろう。
  • 歩留まりは予測され決定される必要があり、適切なコストは目標としている性能カテゴリの主要な要素であり、バランスが必要である。

「Barts」は256bitメモリコントローラか否か

  • 「Barts」の競合製品が何であるか思い出すことは非常に重要だ。それはnVidia Geforce 460GTXで、「256bitメモリコントローラ」を持っている。
  • AMDがそのような製品に128bitメモリコントローラを採用した製品で競争することは無いだろう。
  • 「Cayman」シリーズのDDR5メモリコントローラが「Barts」の1,600MHz(x4)であり、25%しかメモリ帯域が大きくない点がそれを示している。
  • もし40%以上のメモリ帯域を上乗せしても全体の性能は10%未満であろう。
  • 256bitメモリコントローラは確かに20%の性能向上をもたらす。
  • ただ確かな点は「Barts」は他のアーキテクチャ改善を行っているだろう。より多くのメモリ帯域は性能向上を提供するが、GPUとメモリクロックを一緒に上昇させたときの素晴らしい性能向上を思い出して欲しい。

最後に誰もが新しいアーキテクチャはダイサイズが小さくなるとメモリ帯域の制限により性能が制限されてしまうだろうと思うが、より大きなメモリコントローラは「Barts」シリーズに性能改善の多大なる貢献をするだろう。

AMDは同意しているかって?あと数週間でわかるよ。

—-

とりあえずスケジュールがHD5000シリーズ時より1ヶ月遅れているようなので2010年10月頃発表・月末販売開始か?

AMDの次世代GPU「Barts」の情報がリークされる – Geforce GTX460キラーとなるのか?

semiaccurate.com Supposed AMD Barts specifications leak Looking very promising if the price is right by Lars-Göran Nilsson September 16, 2010 より。

噂されていたAMDの「Barts」の詳細がリークされる。

もし金額設定が正しいのなら見る価値アリ
by Lars-Göran Nilsson
2010年9月16日

今回登場したものはChiphell経由で再びこれから登場予定のGPUについてのAMDプレゼンテーションスライドで、それはAMDの登場予定の次世代GPU「Barts」の価格を予測させる全てが暴露されている。AMDはnVidiaのGeforce GTX460モデルに対し2種類のパーツを登場させ、性能と価格の項目両方で比較している興味深いスライドである。

二つのうち下のクラスのGPU「Barts Pro」は768MB GTX460に対して登場し、「Barts XT」は1GB GTX460に対してぶつけられる。私たちがそれらの記載されたカードの組み合わせはより速いオーバークロック出荷バージョンカードの潜在能力を秘めた現在のRadeon HD5830とHD5850にどこか近い性能で落ち着くだろうと推測される。それは、性能はAMDが元々弱点であったベンチマークでの性能を引き上げることに依存した性能向上であろうと言われている。

「Barts Pro」はコアクロックが700〜725MHzで、1GBの256bit GDDR5の実行クロック4GHzのメモリインターフェースを搭載しているだろう。それは10個のSIMDユニットを持ち、40個のテクスチャユニット、800シェーダ、32ROPsおよび128Z/Stencilの性能になるだろう。そのプレゼンスライドは「Barts Pro」が150W以下であると書かれている。「Barts XT」はコアクロック850MHzで実行クロックが4.2GHzに引き上げられた同容量メモリ・メモリインターフェースを搭載しているとある。AMDはまた12個のSIMDユニット、48個のテクスチャユニット、960シェーダまで性能向上されていること特徴としている。「Barts XT」は150W以上であると書かれている。

これは理論上は良く見え、AMDがnVidia GTX460の性能面で打ちのめす役割である「Barts」に大きな問題は存在しないということが隠蔽されている。疑問はそれらのGPUカードがどのくらいの金額で販売されるのかということだが、幸運にもAMDはここで冷静に、私たちは「Barts Pro」が150ドル〜160ドルの間、および「Barts XT」が200ドル以下の価格設定になるだろうと見ている。これは「Barts」が信じられないくらい一般向けのGPUカードとして提供される事になるが、現在のnVidiaの製品価格から判断し、これはあまりにも安すぎてnVidiaが提供するよりも速くて価格に上乗せすることが可能なより速いGPUカードをAMDが提供する場合その価格には期待できないだろう。

—-

AMDのBartsがメインストリーム向けGPUとして登場するということか。

nVidia Geforce GTS450が性能・消費電力・価格共に旧世代Geforceに及ばない

各レビューサイトにnVidia Geforce GTS450について掲載された。私自身は興味はないのだが、レビュー記事が面白かったのでリンクする。l

4gamer.net Fermi世代初のG92後継は,1万円台の市場に嵐を呼ぶか GeForce GTS 450 (MSI N450GTS Cyclone 1GD5/OC) より。

名言がいろいろあってわかり易いレビューである。

  • AMDが「ATI Radeon HD 5700」シリーズの後継製品を,そう遠くない将来に投入するという噂も聞こえてきているだけに,「それを待って,“後出しじゃんけんの法則”で勝てるス ペックに設定し,投入してくるのでは」などという穿った見方もできるが,ともあれ,このあたりの動向には注意を払っておくべきだろう。

メモリパターンに空きがあり、現在の128bit版から192bit版を販売する可能性を示唆しているが、明確に後出しじゃんけんと記述されている。

  • GTS 450を始めとするGeForce製品のテストに用いたグラフィックスドライバは,NVIDIAから全世界のレビュワーに配布された「GeForce Driver 260.52」

とりあえずレビュワー向けのチートドライバですか?

  • 失ったものが大きすぎた?HD 5750と互角の攻防を演じるGTS 450

販売が1年近く遅れて互角の性能とは…。さらにDirectX9等旧世代採用のゲームではGTS250にもベンチマークで負けてしまう。

  • DX9性能が弱点で,GTS 250からの乗り換えは「ない」 買いかどうかは店頭価格次第か
  • 以上,リファレンスクロックで動作する場合のGTS 450が持つポテンシャルを探ってきたが,正直に述べて,GTS 250からGTS 450に乗り換えるメリットはほとんどない。現在大いに注目されている「FINAL FANTASY XIV」を例に挙げるまでもなく,PCゲームの主流はDirectX 9世代だが,DirectX 9世代のゲームを前にしたとき,GTS 250と同等以下のパフォーマンスしか発揮できない可能性があるというのは,やはり痛いところだ。消費電力がHD 5770&5750より高いのも,このクラスでは看過できないところである。

ちなみにDirectX11ならRadeon HD5750を買うほうが良いと書かれてしまった。

pc watch ■多和田新也のニューアイテム診断室■ GF106コア採用のミドルレンジGPU「GeForce GTS 450」 より。

  • ざっくりいうとRadeon HD 5750よりは性能が良い傾向にあるが、Radeon HD 5770を上回るほどではない、といったところだろう。もちろん個別のタイトルではRadeon HD 5770に肉薄および上回れる部分はあるが、全体的にはやや勝ちきれない印象のほうが強い。

ここだけ注目。「Radeon HD 5750よりは性能が良い傾向にあるが、Radeon HD 5770を上回るほどではない」何がなんやら、日本語として破綻寸前の表現にレビュワーも擁護が難しいようだ。

GTS450は価格帯が1万2,000円〜1万6,000円程度になるようだが、それだったら絶賛処分価格のGTX285を買うな。

更新 2010年9月13日

4gamer.net 【リリース】ドスパラ,Low Profile版などPalit製GTS 450カード4製品を発売 より。

さらっと見逃していたが、ロープロファイルで2スロット占有のGTS450ボードだと!?そんなボードが動作するPCなんてどれだけあるんだよ???消費電力と排熱が追いつかないだろww

AMDの次世代GPU「Southern Islands」は実は「Northern Islands」だった? By SemiAccurate Charlie Demerjian氏記事

semiaccurate.com What is AMD’s Northern Islands? A look at what is coming in October by Charlie Demerjian September 6, 2010 より。

最新のやられてしまったことは、AMDがATIを再び切り捨てる(※英文)だけでなくRadeon HD6000シリーズについてだって?このストーリーは長く複雑で、以前まで見えていたことが少しだけいくつかのことがより明快になったことである。

私たちがSemiAccurateとして大変悪かったと謝罪する、それは「Southern Islands」(以下SI)の名前についてである。いいや、SIは本物であり、数カ月前から現在まで「Northern Islands」(以下NI)と呼ばれていた28nmプロセスのチップのことである。日付や機能、そして我々の話したことは置いておいて、ただチップのファミリーネームを入れ替えるだけである。

なぜ?そのことについてはTSMCが非難を受けるべきである。私たちの話しは、AMDが32nmプロセスのNIのテープアウト前にTSMCが32nmプロセスをキャンセル(※英文)した所から始まる。幾人かの人々はそのクソッタレな決定にもちろんカナダ人のような気品あるマナーで大騒ぎしながら暴れたが、あなたは何をすることができた?nVidiaが同じように病気を移されたような発言を行なったが、彼らはテープアウトに近づくことができなくなってしまった。

それは混乱の中からスタートした。32nm NIの一部は「Cozumel」「Kauai」「Ibiza」と呼ばれ(※英文)、それらは突然瞬いた。次の一時しのぎは同じ時期に私たちがSIという名前を聞いたチップについてであり、それはその週占い師に私たちの占いをしてもらった。そのバックアップとして、政府向けHDデコーダボックスが一時しのぎのファミリーとして新しいコードネームを混乱させた。

その一時しのぎのファミリーには最初なんの名前もついていなかったが、その後NI-40と呼ばれるようになり、その後再びNIとだけ呼ばれた。28nmの情報と同じ時期に始まったこれらのことはぷかぷか浮き始め、不幸なことにデコーダがぐずり始めた。私たちはそのファミリーネームを間違ってしまったが、すべてが間違っているわけではない。

内部的に、新しいコードネームとして、「Cayman」「Bats」(※英文)という筋書きが置かれ、その後結局NIラインに再びと称された。私にまだ何かある?もしそうじゃないのなら、いいだろう、わたしはまた間違ってしまった。ともかくそれは私たちが困惑した部分であり理由である。

「Barts」はNIファミリであり、なぜそれらが?ええと、それらは実に単純で、彼らは本気になって「Evergreen」ファミリーをやり直している。その大幅な変化はシェーダー内に秘密があり、それらは4つのシンプルシェーダに1つの複合スシェーダの組み合わせから4つの同じ機能(※ミディアム)の複合シェーダになった。これはの圧倒的な演算量を単純な演算を行う古い方法より遅くならないようにするべきであるが、複合命令(※VLIWのことか?)のほとんどはまた高速に動作する。

その理由として新しい「均等な機能」のシェーダは組み合わせて同じ時間に一つのことしか行うことができないと要約することができるが、それら以上のことがあり、彼らはシェーダ数をより多く入れることができた。かつてGPUはマシンのスループットに支配され、デバイスのレイテンシには行き着かなかったがあなたはその違いを確認できず、それはいくつかの種類の命令がより速く動作するようになっただけであろう。

それらは多分構造的なものか2倍ほど少しだけ遅くなるが、サンプル品のリークがまもなく浮いているサイドデッキの攻撃店を探している。nVidiaがCESでFermiがHeaven benchmarkで多くの箇所でHD5870よりも速いことをプレゼンテーションしていたことを思い出せるか?売上や地位がどのようにして追われたか(※英文)を覚えているか?本物のベンチマーク数値を待って、絶望的に早口のビッググリーンFUD砲(※nVidia広報部によるネガティブキャンペーンのこと)について心配する必要はない。

かつてのシェーダ数は従来のグループの80%となり、いくらかスペースを削減でき、AMDが長い時間かけて最適化したスペースを上部に持ってきている。下部にはわずかばかり大きくなったシェーダがあるが、最終的な結果は従来の4+1シェーダグループよりも新しい4シェーダクラスタがよりスペースが小さく、より速くなる。

アンコア部、もしくは少なくともシェーダ以外も同じように強化され、それは特に強調すべき効果的な強化となっている。最終結果、シェーダの活用の非常に役立つことになり、性能はそれらによりまた増加されている。いくつかのシェーダグループが投入され、NIファミリーは特筆すべき性能向上となる。

HD6000シリーズがローンチされるのは何時かって?それは10月12日であるという噂があちこちで流布しているが、それはローンチ日ではない。10月12日には、HD6000シリーズ関連のイベントが行われるが、それはスケジュール上10月25日の±1日〜2日までカードは販売されないだろう。

その時何がローンチされるのかって?現在AMDがラインナップの穴を開けている175ドル〜250ドルレンジの商品からローンチされ、そこには仮定としてHD6700シリーズがあてられるだろう。驚くべきちょっとした偶然で、それは最初にローンチされることは確実で、その後すぐにHD6800およびHD6900シリーズがそれに続く。2011年初頭には、エントリー向けカードがあとからラインナップに埋められ、そしてそれらはローンチを完了するだろう。28nmプロセスがやってくるまでは。そのとき本当に興味深いことになる。

近い将来に話を戻すと、HD6000シリーズのローンチは基本的に市場に存在するnVidiaのチャンスを埋没させてしまうだろう。緑色のチームはすでに現在のAMD Radeon HD5000シリーズより高コスト構造になっており、最後の手段として、価格下落およびキックバックにより現在の活気のない売上に成功をもたらす必要がある。AMDはその間常に最高価格を維持し続けているが、HD5700シリーズは少しだけゆっくりと値を下げている。

あたかもAMDが部屋に入り込んで彼らの新しいチップをPCのスロットに挿入するようにnVidiaの希望と夢に酷い仕打ちをするだろう。事実、AMDがしていることは確実にnVidiaの儲ける必要のある利益を破壊しており、同じ時期にAMDの在庫は空になっている。

AMDは現在HD5000シリーズを運転席に載せており、nVidiaの競合製品であるGTX400シリーズを2週間以内でHD6000シリーズに置き換えることを実行するだろう。AMDはHD6000シリーズのラインナップが完全に揃うまでの間、開いた穴を従来製品の値下げで対応することができるが、その間、nVidiaは何の反応もできない。

AMDはDirectX11へ最初に対応する競争にHD5000シリーズでたやすくnVidiaに勝利した。HD6000シリーズでは、かれらはより多くの利益と経営状況、そして性能で2度勝利するだろう。TSMCの28nmプロセスが始まるまではnVidiaには何のチャンスもない。しかしその情報は既に少しずつ漏れだしていて、それらことからほんの少しも罵倒されることは予測できない。

—-

Charlie反省文w。この文のすこしまとまりのない部分はvr-zone.comでわかりやすく整理され解説されているが、残念なことにスペースが足りないため翻訳することができない Byフェルマー w。

nVidiaがGeforce GTX460の価格を下げる – 思ったより売れず他にAMDに対抗できる手段がない?

vr-zone.com NVIDIA GeForce GTX 460 Prices Cut Published on Sunday, September 5 2010 7:24 pm by Sub より。

nVidiaがGeforce GTX460の価格を下げる

nVidiaはGF104シリーズとして、Geforce GTX460はより利益率の高い製品の市場シェアを取り戻す為に大々的にリリースされた。GTX460のアグレッシブな価格設定は高性能を求める消費者の眉毛を釣り上げさせ、価格をその対価として受け取った。不幸なことに、Geforce GTX460は供給を上回るような予測よりも売れていない。その結果として既にGTX460はバーゲン特価になり、全体として価格が下げられた。GTX460 768MBの以前の価格は200ドルであったが、現在は180ドル以下となり、GTX460 1GBはまた220ドルに落ちた。

もちろんこの価格下落は驚くことではなく、既にGTX470とGTX480の価格カットの噂と予測があった。リファレンス仕様のGeforce GTX460 768MBはネットショップNeweggでAIC製のボードが現在179ドルから189ドルの間を推移し、199ドルから下がっている。Best DealではEVGA GTX768MB Superclockedは、13%の高クロックスピードによる性能改善を特徴としている。信じられないことに、Neweggでは189ドルで購入可能で、メールリベート(※アメリカの小売店で一般的な値引き方法。購入後メキシコなどにあるリベート送金会社に手紙を送るとその金額だけ数カ月後に返送して貰える)ではなんと179ドルで購入可能である。

1GBバージョンもほんのわずかではあるが同じように影響を受けている。リファレンス仕様のGeforce GTX460 1GBは229ドルでリリースされたが、現在ではZotac、Sparkle、PalitなどのようにAIC製のボードが219ドルに下がっている。オーバークロックエディションはまた平均10ドルほど価格が下がっている。

nVidiaのGeforce GTX470およびGTX480は引き続き300ドルと450ドルで推移している。GTX465は既に姿を消し始めており、例外として200ドル以下でバーゲン価格で販売されているが、GTX460以上のボードを購入する良い買い物とは言えない。不幸にもAMD側では価格が動いておらず、一番安いHISやGigabyte製のATI Radeon HD5830では190ドル、AIC製は199ドルの価格を維持している。HISはまた最も安いRadeon HD5830ボードを270ドルとして販売している。

いろいろな意味で、nVidiaのとんでもないアグレッシブな価格設定はGTX200シリーズを思い起こさせる。400ドルでリリースされたGTX260はATI Radeon HD4870の影響で1週間後にすぐに300ドル以下となった。55nmプロセスにシュリンクされ、216SPのGTX260+は500mm^2もの巨大なダイサイズにもかかわらず、2009年中頃には160ドル以下になった。その競争相手であるRadeon HD4870はたったの256mm^2のダイサイズであった。

Geforce GTX460は既に価格として優れた価値を有しており、その価格はよりバーゲンとして下げられるだろう。179ドルでGTX460はより遅いRadeon HD5770に危険なまでに価格が近づく。それはより遅くより高価なRadeon HD5830を購入する理由を少しだけ上げる。

AMD Radeon HD6000シリーズがリリース寸前に来て、我々はnVidiaがAMDと同じステージで価格競争するだけの余裕があるとは思えない。AMDは既にHD5000シリーズで確固たる性能向上とダイサイズのアドバンテージを有し更に向上するだけだろう。nVidiaにとっては価格を下落させることが唯一の対抗手段である。消費者のためにも短期間で良いニュースが聴ければよいが、私たちが求めている最新のニュースは一つの会社がGPU市場を占有しているということである。

—-

ここ2年ほどAMDがnVidiaとの性能・価格競争で連続勝利中だな。おかげでHD5000シリーズは一向に値段が下がらない…。

nVidiaがGeforce GTX460の価格を下げる