NVIDIAのProject Denverのファーストシリコンは8コアARM、256CUDAコアのAPU?

1st Silicon with NVIDIA Project Denver is an 8-Core ARM, 256 CUDA Core APU? 7/18/2011 by: Theo Valich – Get more from this author より。

NVIDIAのProject Denverのファーストシリコンは8コアARM、256CUDAコアのAPU?

複数のニュースソースから聞いた情報によると、NVIDIAは最近コードネーム「Project Denver」のSoCである最初の「CPU」を目標とした設計を公開し展開を始めた。

私達が入手した情報は、プロジェクトデンバーCPUコアが「T40 – Tegra4 (Wayne)」に非常に似ているように見える。内部スケジュールによると、Wayneのシリコンは今後2週間以内にテープアウトする予定であり、ディベロッパーはそれらのプロトタイプシリコンを2011年12月に手に取ることができるとしている。Wayneシリコンは4つ以上のARMコアから成り立っており(NVIDIAはコアのタイプを公開しておらず、ふざけてて言うならA15かPDであろう)、64個以上のGPUコアを含む。

同じ2011年12月の間に、NVIDIAはProject Dennverをベースにしたファーストシリコンをテープアウトする予定である。それらは8コア以上のNVIDIAカスタムの64bit ARM CPUにGeForce 600クラスのGPUを組み合わせた物である。NVIDIAはCPUの開発に数多くの問題を抱え、一般的な意見としてはNVIDIAはシングルの28nm PD CPU設計と28nm Fermiベースの設計を細葉した慎重なアプローチを取るだろうと言われている。 言い換えれば、ノートPC・ローエンドデスクトップPC向け GeForce 600シリーズカード(「GeForce300」を思い出す?)にリフレッシュしたFermiベースの設計であると噂されてる。

他のニュースソースによるとこのニュースの題名のとおり、シリコンのGPU部分は「少なくとも256 CUDAコア」で、「Northern Islands」とBulldozer拡張CPUを組み合わせたAMDのTrinity APUを目標としているとのこと。VLIW4アーキテクチャとAMDのキーとなるAPUは2012年に登場する予定である。計算処理能力を拡張するため、NVIDIAは天国に登るような高い動作クロックを求めず、それぞれIPC(クロックあたりの処理可能な命令数)の向上を可能な限り高めることを求めている。まだその製品は現実的には2.0-2.5GHzでCPUやGPUが動作するだろうと予測されており、メモリーコントローラーとシリコンの残りの部分はより低い比率のクロックのまま動作すると予測されている。

AMDのAPU設計と異なり、CPUとGPUパーツはDDR3メモリの速度で動作するメモリコントローラにより接続されており、Project DenverはCPUとGPUがより緊密に通信可能な方法を模索しており、言い換えれば最も良いGPU設計は広帯域な接続により実現できるということである。NVIDIAはL1、L2、L3キャッシュの設計を従来通りでは設計せず、GPU部分がキャッシュメモリと1TB/sec以上のコネクションを持っており、噂にあったDenverコア設計と非常に良く似たアプローチをとっている。GPU部分同様に、メモリコントローラーはシリコンダイ面積をとっており、CUDAコアはCPUコアと接続されCPUは接続帯域の要求に対し優先してアクセスできる。

だけれどもNVIDIAはCPUに必要な全帯域の10-20%のみを必要としており、GPUは引き続きシステムメモリが充てられるだろう。

またノートPCやデスクトップ、サーバーのマザーボード設計が進行中で、PCI Express 3.0はメインコネクションの特徴であるとうたわれており、USB3.0やSATA 5GBpsが同時に接続される。これらの与えられた情報によると、NVIDIAは残りの全ての前線に攻撃を仕掛けるようだ。軽量ノートPC分野には低スケールTegra3と4(スマートフォン/タブレット/ネットブック)を割り当て、よりパワフルなシリコンは軽量ノートPCやデスクトップに使われ、サーバー分野にはより興味深い戦略で望むのだろう。

一方、PD CPUの1世代に、NVIDIAはパワフルなGPUを武器にブレードサーバ市場に算入することを望んでいるが、また一方でNVIDIAはTeslaのビジネスでIntelやAMDのx86コアへの依存を排除したがっている(一つのTeslaGPGPUは一つの- XeonかOpteron -が要求される)。それらが等しくx86からの脱却は確実に利益を多く見せるだろうが、一方でAMDとIntelは頭から足の先まで同じシリコンを使ったデスクトップ・ノートPCで利益を充填し楽しんでいる。

うわさ FacebookがARMベースのサーバを採用した? SemiAccurate.com Charlie Demerjian氏

semiaccurate.com Facebook is the first to jump into ARM servers Tectonic change of our time by Charlie Demerjian August 23, 2010 より。

うわさ Facebookがx86ベースからARMベースサーバへ最初にジャンプした?

概要として、

  • FacebookがオレゴンデータセンターでARMベースアーキテクチャのサーバの置換えを始めた。
  • もしこのうわさが本当なら、ARMベースサーバを置き換え、x86サーバを近くの川に投げ込んでいる。
  • うわさの発端はオースティンにあるSmooth-Stone(※英文)である。SuperMicroにもいくつかのうわさがある。
  • これはARMCPUが「充分早い」と言うことであり、疑問としてはワットパフォーマンス及びスレッドパフォーマンスである。
  • Intel/AMDのx86CPUはより多いスレッドをより多い消費電力で動作させる。
  • スレッドあたりの消費電力は少なくともFacebookのPHPベースシステムではARMでは少なくて済む。
  • だけれどもIntelは愚かに恐怖すると思うのは数多くものXeonCPUが多大な消費電力のために潜在的に置き換えらることでもなく、それはAtomで勝利することでもない。実際彼らはARMインストラクションセットアーキテクチャがライバルであるとは直接答えなかった。
  • もしFacebookの実験が良い結果になるのなら、データセンター内で同じように置き換えが始まり、価格を圧縮するだろう。
  • 実際のところFacebookは実験ではなくARMに移行し、そしてより先見性のある代替品に置き換えるだろう。
  • この事はデータセンター内で変化し、あなたはその結果をまだ見ることはないだろう。

—-

斜め読み失礼。最近噂のARMベースサーバですか。かつてのmipsやSPARCなど様々なCPUがサーバで動作していた時代に回帰する感じだろうか。
なおTransmetaは省電力サーバとして生き残りをはかろうとして失敗したが、AMDの「Bulldozer」アーキテクチャは一般向けは浮動小数点演算を、サーバ向けは整数演算を重視されるようになると予想を立て各演算コアを分離独立して動作するようなモジュールアーキテクチャを採用している。

うわさ IntelのGPU統合型CPU「Sandy Bridge」向けLGA-2011「Patsburg」チップセットはちょっとした驚きがあるかも

semiaccurate.com Intel’s Patsburg chipset comes with a few unexpected surprises Many not set in stone yet by Lars-Göran Nilsson August 12, 2010 より。

IntelのPatsburgチップセットはちょっとした驚きがあるかも

by Lars-Göran Nilsson

2010年8月12日

概要は下記の通り。。

  • 「Patsburg」チップセットは、GPU統合型CPU「Sandy Bridge」LGA-2011プロセッサ用のチップセット。
  • Intelは伝統的にデスクトップ向けとサーバ向けCPU「Xeon」向けは別々に開発している。
  • だが「Patsburg」チップセットはハイエンドデスクトップ及びミドルレンジサーバ向けとして発表されるかも。
  • そしてPCI ExpressコントローラはCPU内で別チップとして移動するかも。
  • LGA-2011は現在のLGA-1155とは違い、PCI Express 3.0対応を特徴とする。
  • AMDの次世代GPU「Southern Islands」ではPCi Express 3.0に対応する。
  • Intelのストレージインターフェースは10ポート 6Gbps SAS対応SATAを予定しているが、今のところSemiAccurateは新しいチップセットでは2〜3個の6Gbps SATAポート、3GbpsのSATA6個、そして6個のSASポートがチップセット内に独立したコントローラで接続されると見ている。
  • さらにIntelは4つのメモリーコントローラを提供し、さらに「Sandy Bridge」LGA-2011ではメモリ性能が劇的に改善された新しいリングバスを採用するとのこと。
  • CPUは多分QPIバスを利用するだろう。それはLGA-1155プラットホームの2倍のバス帯域を実現するだろう。
  • このことはデスクトップ向けと1チップXeon向けと同じチップセットをIntelが使用することを想像させる。
  • 4つのメモリスロットに15個のSATA/SASコネクタをマザーボードで提供し、EATX向けとしてはメモリスロットが少ない(EATXでは8スロットが一般的)。ATXではメモリスロットは4つだろう。
  • とりあえず信頼できる筋からのうわさだからね。

—-

斜め読みしたので間違いがあるかと。

PCI Express 3.0のバス帯域を実現するためにもチップセットバスをQPIを採用する必要がある点と、メモリコントローラも帯域性能重視でリングバスを採用するかもと言う点が重要かと。メモリがリングバス接続ということでレイテンシが気になるところ。IntelのCPUとAMDのディスクリートGPUは相性が良いw。

AMD決算 GPUが過去最高の出荷数で40%増収

IT media AMD決算、GPUが過去最高の出荷数で40%増収 より。

AMD、CPU関連の売上高が前年同期比31%の増加。ネットブック向けMPUおよびチップセットの売上増が主要因とのこと。

GPU関連の売上高は前年同期比で87%と大幅に増加したが平均販売単価が下がっため売上高に影響とのことそれでも87%とはIntelの過去最高の増収増益と同じぐらいのインパクトがある。

ただしAMDの会社自体は大幅に縮小したとはいえ純損失を出している状態。対するIntelは純利益29億ドルと勝負にならない。

AMDはGPU以外の事業では完全にIntelに圧倒されている。サーバ関連ではXeonがOpteronを駆逐しており、デスクトップCPUでもCore iシリーズに苦戦中。自作PC関連では低価格6コアCPUとしてPhenom II X6 1055Tが人気のようだが。