NVIDIAのProject Denverのファーストシリコンは8コアARM、256CUDAコアのAPU?

1st Silicon with NVIDIA Project Denver is an 8-Core ARM, 256 CUDA Core APU? 7/18/2011 by: Theo Valich – Get more from this author より。

NVIDIAのProject Denverのファーストシリコンは8コアARM、256CUDAコアのAPU?

複数のニュースソースから聞いた情報によると、NVIDIAは最近コードネーム「Project Denver」のSoCである最初の「CPU」を目標とした設計を公開し展開を始めた。

私達が入手した情報は、プロジェクトデンバーCPUコアが「T40 – Tegra4 (Wayne)」に非常に似ているように見える。内部スケジュールによると、Wayneのシリコンは今後2週間以内にテープアウトする予定であり、ディベロッパーはそれらのプロトタイプシリコンを2011年12月に手に取ることができるとしている。Wayneシリコンは4つ以上のARMコアから成り立っており(NVIDIAはコアのタイプを公開しておらず、ふざけてて言うならA15かPDであろう)、64個以上のGPUコアを含む。

同じ2011年12月の間に、NVIDIAはProject Dennverをベースにしたファーストシリコンをテープアウトする予定である。それらは8コア以上のNVIDIAカスタムの64bit ARM CPUにGeForce 600クラスのGPUを組み合わせた物である。NVIDIAはCPUの開発に数多くの問題を抱え、一般的な意見としてはNVIDIAはシングルの28nm PD CPU設計と28nm Fermiベースの設計を細葉した慎重なアプローチを取るだろうと言われている。 言い換えれば、ノートPC・ローエンドデスクトップPC向け GeForce 600シリーズカード(「GeForce300」を思い出す?)にリフレッシュしたFermiベースの設計であると噂されてる。

他のニュースソースによるとこのニュースの題名のとおり、シリコンのGPU部分は「少なくとも256 CUDAコア」で、「Northern Islands」とBulldozer拡張CPUを組み合わせたAMDのTrinity APUを目標としているとのこと。VLIW4アーキテクチャとAMDのキーとなるAPUは2012年に登場する予定である。計算処理能力を拡張するため、NVIDIAは天国に登るような高い動作クロックを求めず、それぞれIPC(クロックあたりの処理可能な命令数)の向上を可能な限り高めることを求めている。まだその製品は現実的には2.0-2.5GHzでCPUやGPUが動作するだろうと予測されており、メモリーコントローラーとシリコンの残りの部分はより低い比率のクロックのまま動作すると予測されている。

AMDのAPU設計と異なり、CPUとGPUパーツはDDR3メモリの速度で動作するメモリコントローラにより接続されており、Project DenverはCPUとGPUがより緊密に通信可能な方法を模索しており、言い換えれば最も良いGPU設計は広帯域な接続により実現できるということである。NVIDIAはL1、L2、L3キャッシュの設計を従来通りでは設計せず、GPU部分がキャッシュメモリと1TB/sec以上のコネクションを持っており、噂にあったDenverコア設計と非常に良く似たアプローチをとっている。GPU部分同様に、メモリコントローラーはシリコンダイ面積をとっており、CUDAコアはCPUコアと接続されCPUは接続帯域の要求に対し優先してアクセスできる。

だけれどもNVIDIAはCPUに必要な全帯域の10-20%のみを必要としており、GPUは引き続きシステムメモリが充てられるだろう。

またノートPCやデスクトップ、サーバーのマザーボード設計が進行中で、PCI Express 3.0はメインコネクションの特徴であるとうたわれており、USB3.0やSATA 5GBpsが同時に接続される。これらの与えられた情報によると、NVIDIAは残りの全ての前線に攻撃を仕掛けるようだ。軽量ノートPC分野には低スケールTegra3と4(スマートフォン/タブレット/ネットブック)を割り当て、よりパワフルなシリコンは軽量ノートPCやデスクトップに使われ、サーバー分野にはより興味深い戦略で望むのだろう。

一方、PD CPUの1世代に、NVIDIAはパワフルなGPUを武器にブレードサーバ市場に算入することを望んでいるが、また一方でNVIDIAはTeslaのビジネスでIntelやAMDのx86コアへの依存を排除したがっている(一つのTeslaGPGPUは一つの- XeonかOpteron -が要求される)。それらが等しくx86からの脱却は確実に利益を多く見せるだろうが、一方でAMDとIntelは頭から足の先まで同じシリコンを使ったデスクトップ・ノートPCで利益を充填し楽しんでいる。

nVidiaはCUDAのx86アーキテクチャへの最適化にほとんど興味がない – アナリスト談

xbitlabs.com Nvidia Hardly Interested in Optimal Performance of CUDA on x86 Processors – Analyst. Despite CUDA x86 Cross-Compiler, Life of Programmers Will Not Get Easier [09/28/2010 07:49 PM] by Anton Shilov より。

nVidiaはCUDAのx86アーキテクチャへの最適化にほとんど興味がない – アナリスト談

CUDAのx86向けクロスコンパイラに反して、プログラマの生活はより良くはならないだろう。
Anton Shilov
2010年9月28日

nVidiaとPortland Groupは先週nVidia CUDAアーキテクチャからx86へ、又は逆にx86からCUDAへソフトウエアを開発することができる特別なコンパイラを登場させた。これはソフトウエア開発者が彼らのプログラムに広く互換性を保証し、高並列GPUアーキテクチャを活用できることを提案している。だけれども、ソフトウエアメーカの生活はより良くなることはないだろうと、Jon Peddie ResearchのAlex Herreraは語った。

異なるアプリケーションのため、これらにはスーパーコンピュータ分野も含まれるが、より高い性能を照らす光明があるにもかかわらずATI RadeonやnVidia Geforceのようなグラフィクスプロセッサのために作り直されることはない多くの理由がある。主な理由の一つは、これまでも使われているレガシーなコードがあり、既に業務で使用されているためほとんどど捨てることができない。コンパイラはPGIとnVidiaが共同でソフトウエア開発者にCUDAベースのソフトウエアをx86プラットフォームにアプローチすることでテストしてもらいたがっており、信頼度を測ってもらいたがっている。それにもかかわらず、十分に安定して動作しているが、CUDAベースのソフトウエアのx86アーキテクチャでの性能はほとんど最適化されていない、とHerrera氏は主張している。

GPUベースのnVidia PhysXがそうであるようにCUDAもまたSSE2等のSIMDインストラクションをサポートしていない。新しいコンパイラはAMD BulldozerやIntel Sandy Bridgeマイクロプロセッサで使われる予定のAVXのようなものもサポートしないだろう。その結果、アプリケーションソフトウエアはx86プラットフォームでは最高性能を発揮できないだろ。

「x86で動作するCUDAはCUDAを使用しないでx86アーキテクチャに最適化されたアプリケーションソフトより遅くなるだろう。そしてx86で動作するCUDAアプリケーションやFermiで動作するアプリケーションを動作させる開発者は、最初に簡便に最適化できるCUDA無しのx86プラットフォームのほうが他のCUDAベースのアプリケーションよりも速く動作するのを目撃するだろう。より大きな性能向上によるベンチマーク数値はnVidiaが多くの浮動小数点演算を多用するアプリケーションソフトウエアでCPUよりもGPUのほうがより速いと宣伝する目的で使用されるだろう。」とアナリストは語った。

最後に、特定の目的および一般向け商用ソフトウエアの設計者は異なるハードウエアのために異なるコードを実装する必要が出てくるだろうし、いくつかは既に行われている。


開発側の負担が大きくなるだけで誰も得をしないということだな、nVidiaのCUDAは。あくまでも宣伝用でしか無いと。

nVidiaのノートPC向けDirectX11対応GPU Geforce GTX400Mシリーズがフルラインナップで登場

anandtech.com NVIDIA 400M: DX11 Top to Bottom Solutions Now Available by Jarred Walton on 9/3/2010 12:02:00 AM より。

4gamer.net NVIDIA,ノートPC向けGPU「GeForce 400M」の新製品7モデルを一挙発表 ライター:宮崎真一 より。

概要として、

  • nVidia Geforce GTX480MはGF100のダウンクロック版。
  • 実際デスクトップ向けGTX465と同じコア数。消費電力(TDP?)は驚異の100W。
  • Optimusテクノロジでアイドル時のGPU消費電力は0Wだそうだが。
NVIDIA High-End 400M Specifications
GeForce GTX 480M GeForce GTX 470M GeForce GTX 460M
Codename GF100 GF104? GF104?
CUDA Cores 352 288 192
Graphics Clock (MHz) 425 535 675
Processor Clock (MHz) 850 1100 1350
Memory Clock (MHZ) 1200 1250 1250
Standard Memory Configuration GDDR5 GDDR5 GDDR5
Memory Interface Width 256-bit 192-bit 192-bit
Memory Bandwidth (GB/sec) 76.8 60 60
SLI Ready Yes Yes Yes

票の出典はanandtech.com

  • 対応技術 : DirectX11, OpenGL 4.0, PhysX, Optimus, CUDA, DirectCompute, OpenCL, H.264/VC1/MPEG2 1080p ハードウエア動画デコード, Blu-ray デコードフル対応。HDMI 1.4a対応。
  • 直接の競合はAMDのMobility Radeon 5800・5700・5600シリーズ。
NVIDIA Performance and Mainstream 400M Specifications
GeForce GT 445M GeForce GT 435M GeForce GT 425M GeForce GT 420M GeForce GT 415M
Codename GF104 and GF106? GF106? GF106? GF106? GF108?
CUDA Cores 144 96 96 96 48
Graphics Clock (MHz) 590 650 560 500 500
Processor Clock (MHz) 1180 1300 1120 1000 1000
Memory Clock (MHZ) 800/1250 800 800 800 800
Standard Memory Configuration DDR3/GDDR5 DDR3 DDR3 DDR3 DDR3
Memory Interface Width 128/192-bit 128-bit 128-bit 128-bit 128-bit
Memory Bandwidth (GB/sec) 25.6/60.0 25.6 25.6 25.6 25.6
SLI Ready No No No No No

票の出典はanandtech.com

  • これらのチップはすべてSLI非対応。
  • とりあえず300Mシリーズ比で平均40%の性能向上を果たしている。
  • Optimus技術を使っている会社はAcer、Asus、Dell、Lenovo、Samsung、Toshibaだが、IntelのSandy Bridgeが登場したら必要なくなる可能性がある。

—-

どうみてもノートPCに採用できる消費電力じゃないな。AMDのノート向けGPUチップは注文が殺到しているようだが…

うわさ nVidia Geforce GTS450のスペックが明らかに…? by Fudzilla

fudzilla.com  Friday, 27 August 2010 10:33 Nvidia’s GTS 450 gets fully spec’d Written by Slobodan Simic より。

うわさ nVidia Geforce GTS450のスペックが明らかに…? by Fudzilla

概要として、

  • nVidia Geforce GTS450はGF106アーキテクチャ。
  • 192CUDAコア及び789MHzGPUクロックである。
  • メモリはGDDR5の1566MHz駆動で128bit接続で1GB搭載。
  • DirectX11をサポートし、nVidia独自技術へも対応(CUDA,PhysX)
  • TSMCの40nmプロセス製造される。
  • 競合製品はAMD Radeon HD5700シリーズ。

—-
今更感漂うGTS450だが、多少発熱が激しくてもこれからの季節は涼しくなるから問題は少ないかも。

既にRadeon HD6000の方に興味が移っているし。

nVidia Geforce GTX460の性能が良いことについて(ただしGTX465比較) 修正

PC Watch 後藤弘茂のWeekly海外ニュース GF100を大幅拡張したGeForce GTX 460アーキテクチャ

4gamer GeForce GTX 460リファレンスカード MSI N460GTX Cyclone 768D5/OC EVGA 768-P3-1360-KR

AKIBA PC HOTLINE! 2010年7月17日号 Geforce GTX4シリーズの中堅モデル「460」が発売、2万円 より。

ライバルに遅れること10ヶ月、DirectX11対応GPUミドルレンジ向けnVidia Geforce GTX460(GF104アーキテクチャ)はFermi(GF100アーキテクチャ)を改良しグラフィクス部分とCUDA部分に手を加えてコンシューマ向けには不要なECC(エラー訂正符号)機能を外した物となっている。DirectX11チップとしてなかなか性能が良いようだ(ただしnVidia製品比較)。価格も20,000円前後とお値打ち感がある。

AMD ATI Radeon HD5850とHD5830に対抗できると思う。ただし消費電力はRadeon比では高めな点とEyefinityなどの機能面ではRadeon HD5850やHD5830が良い。また冷却ファンの音量はRadeon比で大きめとのこと。

その一方でGeforce GTX465はGTX480やGTX470の選別落ちの中からさらに動かないSPを動作しない様にした不良チップの再生品なので大消費電力・低性能と購入する理由は無いと断言して良い。

またGTX460も1GB版と768MB版が同じ型番なのは混乱の元。性能が良いのは1GB版のほうなので注意しないといけない。DirectX9対応ゲームに関してはFermiアーキテクチャらしくGT200アーキテクチャに比べて苦手の模様。

GPGPUに関して言えばGTX460は倍精度演算が単精度に対してピーク性能が8%の速度で事実上のGPGPU路線転換と見て良い。

4gamerの記事まとめが秀逸。「GTX465とはいったいなんだったのか」w

GTX460はGTX465キラーとまとめているが自身の会社製品を狙い撃ちしてどうするw

ライバル会社の製品を狙えよ。

関連記事として、GTX460をはじめとしたFermiアーキテクチャがもたらすnVidiaの経営面の問題を書いたSemiaccurateのCharlie氏の記事を翻訳したのでリンクしておく。