nVidiaはCUDAのx86アーキテクチャへの最適化にほとんど興味がない – アナリスト談

xbitlabs.com Nvidia Hardly Interested in Optimal Performance of CUDA on x86 Processors – Analyst. Despite CUDA x86 Cross-Compiler, Life of Programmers Will Not Get Easier [09/28/2010 07:49 PM] by Anton Shilov より。

nVidiaはCUDAのx86アーキテクチャへの最適化にほとんど興味がない – アナリスト談

CUDAのx86向けクロスコンパイラに反して、プログラマの生活はより良くはならないだろう。
Anton Shilov
2010年9月28日

nVidiaとPortland Groupは先週nVidia CUDAアーキテクチャからx86へ、又は逆にx86からCUDAへソフトウエアを開発することができる特別なコンパイラを登場させた。これはソフトウエア開発者が彼らのプログラムに広く互換性を保証し、高並列GPUアーキテクチャを活用できることを提案している。だけれども、ソフトウエアメーカの生活はより良くなることはないだろうと、Jon Peddie ResearchのAlex Herreraは語った。

異なるアプリケーションのため、これらにはスーパーコンピュータ分野も含まれるが、より高い性能を照らす光明があるにもかかわらずATI RadeonやnVidia Geforceのようなグラフィクスプロセッサのために作り直されることはない多くの理由がある。主な理由の一つは、これまでも使われているレガシーなコードがあり、既に業務で使用されているためほとんどど捨てることができない。コンパイラはPGIとnVidiaが共同でソフトウエア開発者にCUDAベースのソフトウエアをx86プラットフォームにアプローチすることでテストしてもらいたがっており、信頼度を測ってもらいたがっている。それにもかかわらず、十分に安定して動作しているが、CUDAベースのソフトウエアのx86アーキテクチャでの性能はほとんど最適化されていない、とHerrera氏は主張している。

GPUベースのnVidia PhysXがそうであるようにCUDAもまたSSE2等のSIMDインストラクションをサポートしていない。新しいコンパイラはAMD BulldozerやIntel Sandy Bridgeマイクロプロセッサで使われる予定のAVXのようなものもサポートしないだろう。その結果、アプリケーションソフトウエアはx86プラットフォームでは最高性能を発揮できないだろ。

「x86で動作するCUDAはCUDAを使用しないでx86アーキテクチャに最適化されたアプリケーションソフトより遅くなるだろう。そしてx86で動作するCUDAアプリケーションやFermiで動作するアプリケーションを動作させる開発者は、最初に簡便に最適化できるCUDA無しのx86プラットフォームのほうが他のCUDAベースのアプリケーションよりも速く動作するのを目撃するだろう。より大きな性能向上によるベンチマーク数値はnVidiaが多くの浮動小数点演算を多用するアプリケーションソフトウエアでCPUよりもGPUのほうがより速いと宣伝する目的で使用されるだろう。」とアナリストは語った。

最後に、特定の目的および一般向け商用ソフトウエアの設計者は異なるハードウエアのために異なるコードを実装する必要が出てくるだろうし、いくつかは既に行われている。


開発側の負担が大きくなるだけで誰も得をしないということだな、nVidiaのCUDAは。あくまでも宣伝用でしか無いと。

AMDの次世代GPU「Southern Islands」は実は「Northern Islands」だった? By SemiAccurate Charlie Demerjian氏記事

semiaccurate.com What is AMD’s Northern Islands? A look at what is coming in October by Charlie Demerjian September 6, 2010 より。

最新のやられてしまったことは、AMDがATIを再び切り捨てる(※英文)だけでなくRadeon HD6000シリーズについてだって?このストーリーは長く複雑で、以前まで見えていたことが少しだけいくつかのことがより明快になったことである。

私たちがSemiAccurateとして大変悪かったと謝罪する、それは「Southern Islands」(以下SI)の名前についてである。いいや、SIは本物であり、数カ月前から現在まで「Northern Islands」(以下NI)と呼ばれていた28nmプロセスのチップのことである。日付や機能、そして我々の話したことは置いておいて、ただチップのファミリーネームを入れ替えるだけである。

なぜ?そのことについてはTSMCが非難を受けるべきである。私たちの話しは、AMDが32nmプロセスのNIのテープアウト前にTSMCが32nmプロセスをキャンセル(※英文)した所から始まる。幾人かの人々はそのクソッタレな決定にもちろんカナダ人のような気品あるマナーで大騒ぎしながら暴れたが、あなたは何をすることができた?nVidiaが同じように病気を移されたような発言を行なったが、彼らはテープアウトに近づくことができなくなってしまった。

それは混乱の中からスタートした。32nm NIの一部は「Cozumel」「Kauai」「Ibiza」と呼ばれ(※英文)、それらは突然瞬いた。次の一時しのぎは同じ時期に私たちがSIという名前を聞いたチップについてであり、それはその週占い師に私たちの占いをしてもらった。そのバックアップとして、政府向けHDデコーダボックスが一時しのぎのファミリーとして新しいコードネームを混乱させた。

その一時しのぎのファミリーには最初なんの名前もついていなかったが、その後NI-40と呼ばれるようになり、その後再びNIとだけ呼ばれた。28nmの情報と同じ時期に始まったこれらのことはぷかぷか浮き始め、不幸なことにデコーダがぐずり始めた。私たちはそのファミリーネームを間違ってしまったが、すべてが間違っているわけではない。

内部的に、新しいコードネームとして、「Cayman」「Bats」(※英文)という筋書きが置かれ、その後結局NIラインに再びと称された。私にまだ何かある?もしそうじゃないのなら、いいだろう、わたしはまた間違ってしまった。ともかくそれは私たちが困惑した部分であり理由である。

「Barts」はNIファミリであり、なぜそれらが?ええと、それらは実に単純で、彼らは本気になって「Evergreen」ファミリーをやり直している。その大幅な変化はシェーダー内に秘密があり、それらは4つのシンプルシェーダに1つの複合スシェーダの組み合わせから4つの同じ機能(※ミディアム)の複合シェーダになった。これはの圧倒的な演算量を単純な演算を行う古い方法より遅くならないようにするべきであるが、複合命令(※VLIWのことか?)のほとんどはまた高速に動作する。

その理由として新しい「均等な機能」のシェーダは組み合わせて同じ時間に一つのことしか行うことができないと要約することができるが、それら以上のことがあり、彼らはシェーダ数をより多く入れることができた。かつてGPUはマシンのスループットに支配され、デバイスのレイテンシには行き着かなかったがあなたはその違いを確認できず、それはいくつかの種類の命令がより速く動作するようになっただけであろう。

それらは多分構造的なものか2倍ほど少しだけ遅くなるが、サンプル品のリークがまもなく浮いているサイドデッキの攻撃店を探している。nVidiaがCESでFermiがHeaven benchmarkで多くの箇所でHD5870よりも速いことをプレゼンテーションしていたことを思い出せるか?売上や地位がどのようにして追われたか(※英文)を覚えているか?本物のベンチマーク数値を待って、絶望的に早口のビッググリーンFUD砲(※nVidia広報部によるネガティブキャンペーンのこと)について心配する必要はない。

かつてのシェーダ数は従来のグループの80%となり、いくらかスペースを削減でき、AMDが長い時間かけて最適化したスペースを上部に持ってきている。下部にはわずかばかり大きくなったシェーダがあるが、最終的な結果は従来の4+1シェーダグループよりも新しい4シェーダクラスタがよりスペースが小さく、より速くなる。

アンコア部、もしくは少なくともシェーダ以外も同じように強化され、それは特に強調すべき効果的な強化となっている。最終結果、シェーダの活用の非常に役立つことになり、性能はそれらによりまた増加されている。いくつかのシェーダグループが投入され、NIファミリーは特筆すべき性能向上となる。

HD6000シリーズがローンチされるのは何時かって?それは10月12日であるという噂があちこちで流布しているが、それはローンチ日ではない。10月12日には、HD6000シリーズ関連のイベントが行われるが、それはスケジュール上10月25日の±1日〜2日までカードは販売されないだろう。

その時何がローンチされるのかって?現在AMDがラインナップの穴を開けている175ドル〜250ドルレンジの商品からローンチされ、そこには仮定としてHD6700シリーズがあてられるだろう。驚くべきちょっとした偶然で、それは最初にローンチされることは確実で、その後すぐにHD6800およびHD6900シリーズがそれに続く。2011年初頭には、エントリー向けカードがあとからラインナップに埋められ、そしてそれらはローンチを完了するだろう。28nmプロセスがやってくるまでは。そのとき本当に興味深いことになる。

近い将来に話を戻すと、HD6000シリーズのローンチは基本的に市場に存在するnVidiaのチャンスを埋没させてしまうだろう。緑色のチームはすでに現在のAMD Radeon HD5000シリーズより高コスト構造になっており、最後の手段として、価格下落およびキックバックにより現在の活気のない売上に成功をもたらす必要がある。AMDはその間常に最高価格を維持し続けているが、HD5700シリーズは少しだけゆっくりと値を下げている。

あたかもAMDが部屋に入り込んで彼らの新しいチップをPCのスロットに挿入するようにnVidiaの希望と夢に酷い仕打ちをするだろう。事実、AMDがしていることは確実にnVidiaの儲ける必要のある利益を破壊しており、同じ時期にAMDの在庫は空になっている。

AMDは現在HD5000シリーズを運転席に載せており、nVidiaの競合製品であるGTX400シリーズを2週間以内でHD6000シリーズに置き換えることを実行するだろう。AMDはHD6000シリーズのラインナップが完全に揃うまでの間、開いた穴を従来製品の値下げで対応することができるが、その間、nVidiaは何の反応もできない。

AMDはDirectX11へ最初に対応する競争にHD5000シリーズでたやすくnVidiaに勝利した。HD6000シリーズでは、かれらはより多くの利益と経営状況、そして性能で2度勝利するだろう。TSMCの28nmプロセスが始まるまではnVidiaには何のチャンスもない。しかしその情報は既に少しずつ漏れだしていて、それらことからほんの少しも罵倒されることは予測できない。

—-

Charlie反省文w。この文のすこしまとまりのない部分はvr-zone.comでわかりやすく整理され解説されているが、残念なことにスペースが足りないため翻訳することができない Byフェルマー w。

うわさ nVidiaがGF108ベースのGeforce GT430を2010年9月中に投入する? ニュース元 Fudzilla

vr-zone.com [Rumour] NVIDIA preparing GeForce GT 430 Published on Monday, August 23 2010 7:15 pm by Sub より。

うわさ nVidiaがGeforce GT430を準備中?

by Sub

2010年8月23日

nVidiaの次の製品リリースは9月13日のGF106ベースであるGeforce GTS450(※英文)だと広く信じられている。FudzillaはnVidiaは派生物であるGT430を準備しているとレポートしている。興味深いことに、彼らはまたGTS450に言及している。これはGTS450との違いがあるかどうか、新しいリネーム製品なのか、または単純にタイプミスなのかもしれない。GT430は100ドル未満市場をターゲットとしたGF108ベースであると考えるのが最も適切であろう。

GT430のコアクロックは700MHzである。私たちはシェーダクロックを1,400MHzと予想しているが、シェーダ数は不明なままである。96ストリームプロセッサ数はかつてGF108のうわさで流れた数である。メモリインターフェースは128bitでメモリクロックは900MHzである。メモリ規格がGDDR3かGDDR5かどうかは言及されていない。

GT430のチップサイズは29mm×29mmと言及されており、それは841mm^2と同じであり、それは確実に間違っている。多分これはチップのみのサイズではなくダイパッケージを含んだ全体のサイズと考えるのが適当であろう。GF108は以前に130mm^2と見積もられている(※英文)。

nVidiaはうわさでは製品ラインにいくつかのカードを追加するようだ。 512ストリームプロセッサのGF100や、SPをすべて動作可能にしたGF104、デュアルGF104、2種類のGF106そして最後にGF108である。もし彼らが残りが見えるのならリリースするのであろう。GT430はGTS450の後にリリースするであろう。その場合は私たちは10月から11月の時間枠の中で行われると予測している。

参照元: Fudzilla

—-

いまあちこちで出回っているnVidia Geforce GT430についてのニュースの分析である。ソース元がFudzillaなので話半分で読んで
2010年10月にはAMDの次世代GPU「Southern Islands」HD6000シリーズが登場するといううわさもあるがnVidia大丈夫か?

nVidia Fermi GF104とGF106ベースのGTS455、GTS450、GTF445が登場かも?

2ちゃんねる自作版Geforce葬儀場スレ⑧④より。

http://www.hardware-infos.com/news.php?news=3630 (ドイツ語)

GF106アーキテクチャのGTS450は240SP 128bit、更にスペックを抑えたGTS445が噂に登ってきた。

GF104アーキテクチャを更にスペックダウンされたGTS455も登場するかも。

  • GTX480 GF100 : GF100ベース 本来目標としたスペックにプロセス問題で届かず、8SMのうち1SMを不活性にして販売
  • GTX470 GF100 : GF100ベース 1SM 32SP削減の活入れ不良品
  • GTX465 GF100 : GF100ベース 3SM 128 SP削減の廃品の再生品
  • GTX460 GF104 : GF104ベース 1GB版の性能を宣伝して768MB版を販売する誤解上等マーケティング中。
  • GTS455 GF104 : GF104ベース SP削減?
  • GTS450 GF106 : GF106ベース 240SP メモリ帯域は128bit
  • GTS445 GF106 : GF106ベース ローエンド向け

SemiAccurate nVidia GTX460のダイサイズとFermiアーキテクチャの失敗 の記事の予想と実際にどうなるか。

nVidia Geforce GTX460の性能が良いことについて(ただしGTX465比較) 修正

PC Watch 後藤弘茂のWeekly海外ニュース GF100を大幅拡張したGeForce GTX 460アーキテクチャ

4gamer GeForce GTX 460リファレンスカード MSI N460GTX Cyclone 768D5/OC EVGA 768-P3-1360-KR

AKIBA PC HOTLINE! 2010年7月17日号 Geforce GTX4シリーズの中堅モデル「460」が発売、2万円 より。

ライバルに遅れること10ヶ月、DirectX11対応GPUミドルレンジ向けnVidia Geforce GTX460(GF104アーキテクチャ)はFermi(GF100アーキテクチャ)を改良しグラフィクス部分とCUDA部分に手を加えてコンシューマ向けには不要なECC(エラー訂正符号)機能を外した物となっている。DirectX11チップとしてなかなか性能が良いようだ(ただしnVidia製品比較)。価格も20,000円前後とお値打ち感がある。

AMD ATI Radeon HD5850とHD5830に対抗できると思う。ただし消費電力はRadeon比では高めな点とEyefinityなどの機能面ではRadeon HD5850やHD5830が良い。また冷却ファンの音量はRadeon比で大きめとのこと。

その一方でGeforce GTX465はGTX480やGTX470の選別落ちの中からさらに動かないSPを動作しない様にした不良チップの再生品なので大消費電力・低性能と購入する理由は無いと断言して良い。

またGTX460も1GB版と768MB版が同じ型番なのは混乱の元。性能が良いのは1GB版のほうなので注意しないといけない。DirectX9対応ゲームに関してはFermiアーキテクチャらしくGT200アーキテクチャに比べて苦手の模様。

GPGPUに関して言えばGTX460は倍精度演算が単精度に対してピーク性能が8%の速度で事実上のGPGPU路線転換と見て良い。

4gamerの記事まとめが秀逸。「GTX465とはいったいなんだったのか」w

GTX460はGTX465キラーとまとめているが自身の会社製品を狙い撃ちしてどうするw

ライバル会社の製品を狙えよ。

関連記事として、GTX460をはじめとしたFermiアーキテクチャがもたらすnVidiaの経営面の問題を書いたSemiaccurateのCharlie氏の記事を翻訳したのでリンクしておく。