AMDは3DNow!使用サポートを終了する。

xbitlabs.com AMD Drops Support of 3DNow! Instructions.AMD’s Future Chips Will Not Support 3DNow! [08/19/2010 11:20 PM] by Anton Shilov より。

AMDは3DNow!使用サポートを終了する。

AMDの今後のチップでは3DNow!はサポートしない。

by Anton Shilov

2010年8月19日

AMDはK6-2の時代までさかのぼって、単一命令複数データストリームコマンド(SIMD)か他のベクトル化命令とし知られとして機能する「3DNow!」を導入した。その「3DNow!」は浮動小数点演算の性能を大幅に改善する予定であったが、数多くのプログラムが実際に活用することなかった。結果として、10年の時を経てAMDはそのコンセントを抜き、将来のチップで「3DNow!」をサポートしないことをに決定した。

「(3DNow!の命令まで)私たちは広く使われているストリーミングSIMD拡張命令(SSE)およびその連続したバージョンなど多くのSIMDコマンド群を自身のプロセッサに実装した。『3DNow!』命令は廃止され、これから登場するAMDのプロセッサでは確実にサポートされないだろう。それらのプロセッサでは、『3DNow!』命令用フラグビットはセットされない。」とシニアディベロッパリレーションズエンジニアのSharon Troiaは記載している(※英文)。

「3DNow!」命令が開発された同じ時代を見てみると、もしプロセッサが命令もしくは命令群をサポートしているのなら、プログラマたちはチェックのため試行錯誤のモデルを利用した。これはアプリケーションはもし命令を実行することが可能なら、実行できるかを試す。もしアプリケーションがプロセッサから例外処理(#UD)を受け取ったら、その命令は実行不可能であると信じている。これらのタイプのアプリケーションは新しい仮想マシンの元ではうまくする動作させることができないだろう。それは他のブログで記述されている。

PREFETCHとPREFETCHW命令のある「3DNow!」バージョンは現在彼ら自身によって分類され、AMDはそれらのサポートを継続する計画である。

それはメインストリームアプリケーションがSSEパスのように「3DNow!」ではないコードを使用すると観るのが最もありえることである。

—-

当初AMDの3DNow!K6-2で登場した際に、IntelはまだMMXのみで整数演算のみのSIMDコマンドだった。そのためmp3エンコーダ「lame」を3DNow!命令を利用し高速化した「午後のこ〜だ」をその当時使っていたな。

Cyrixなど他社にも導入され先進性があったが、仮想マシン技術が普及するにつれ独自実装のコマンドは使いにくくなっているのか。一時代が終わろうとしている。

更新 2010年8月22日

AMD 公式ブログ All of AMDへのリンク 3DNow! instruction are Being Deprecated(※英文)

IntelがOpenCL向けSDKを年度末に発表 ただしCPUのみを利用する

hardware-infos.com Intel springt auf den OpenCL-Zug auf より。

概要は下記の通り。

  • Intelが自社製品向けにOpenCL SDKを2010年末に提供すると発表した。
  • OpenCLはKhronos Groupによって策定されたヘテロジニアスアーキテクチャ向けパラレルプログラムライブラリ
  • ヘテロジニアスシステムとは、CPU+GPUという異なるアーキテクチャシステムの組み合わせのこと。現在のPC向けCPUは、コア毎に機能に違いのないホモジニアスアーキテクチャ。
  • Intelは自社のCPU向けにAVXやSSEに対応させたOpenCL SDKを提供する。これで15%前後性能が改善する。
  • 現在IntelはCPUとGPUが連動したSDKは提供する意向は見られない。
  • だが疑問点として、Sandy BridgeのようなGPU統合型CPUでOpenCLを実行する場合はGPUの機能を活用するのだろうか?

—-

AMDはFusion APUでOpenCL環境を提供するといううわさがあるんで、Intelも時期が来たら提供はするだろうけど積極的に推進することは当面無さそう。

うわさ AMDの次世代CPU「Bulldozer」は動的パフォーマンスブースト機能はないらしい

xbitlabs.com AMD Bulldozer Microprocessors May Not Bring Dramatic Performance Boosts.AMD Expects 16-Core Microprocessors to Be 50% Faster than 12-Core Chips [08/03/2010 02:10 PM] by Anton Shilov より。

うわさ AMDの次世代CPU「Bulldozer」は動的パフォーマンスブースト機能はないらしい

AMDは12コアチップよりも16コアチップCPUが50%高速であると予測している。

アナリストと市場観測者はAMDのコードネーム「Bulldoser」CPUは現在AMD出荷しているCPUと比較して明確に性能が向上していると予測している。しかしアーキテクチャとしての視点からは素晴らしく観えるが、AMD自身は桁外れの性能向上について大きく主張していない。事実、新しい「Bulldozer」ベースのCPUの「コアあたりの性能」は現在のチップと比較してほんのわずかだけ良いだろう。

「性能面における視点からは、もし私たちの16コア「Interlagos」と現在の12コアAMD Opteron 6100シリーズプロセッサ(コードネーム「Magny Cours」)を比較すると消費者からは33%増加したコアから50%のより高い性能を見て取れるだろうと私たちは予想している。これは私たちがコアあたりの性能が正しい上向きの方向性にぴったりと合っていると評価していることを意味する。」とAMDサーバ・ワークステーション製品マーケティング取締役のJohn Frueheは説明した。

「Bulldozer」の「コアあたりの性能」が高い期待を持てないのなら、新しいチップはAMDにこれからのマイクロプロセッサが消費電力の増加や熱損失を伴わずに達成させるだろう。

去年の11月の定期アナリストデイでAMDによって提供された情報を元にすると、最初の「Bulldozer」マイクロアーキテクチャはコードネーム「Zambezi(ほぼ確実にOrochiファミリーに属している)」と呼ばれるデスクトップ・ワークステーション向けCPUチップは、マルチスレッディングテクノロジを持つ8コアのx86コアで、2つの128bit FMAC浮動小数点演算ユニット、共有L2キャッシュ、メモリコントローラ統合型共有L3キャッシュを特徴とするだろう。AMDはまたその新しいCPUは「大きな新しい電力管理の革新」を特徴とするであろうと記載している。「Bulldozer」ファミリーに属している新しいチップはまた256bit浮動小数点演算命令をサポートするAdvanced Vector Extensions(AVX – ※従来のSSEの新しいバージョン)を特徴としている。過去にAMDがデモを行なった際の模式図を元に、AMDは4コアが互いにより良く動作させるために分割されたデータキャッシュと一つの浮動小数点スケジューラ、二つの整数演算ユニットの助けを借りて劇的に改善することを目的としてる。

2010年第2四半期世界で2番目に巨大なCPU会社は最初の「Bulldozer」マイクロプロセッサを「テープアウト」した。「テープアウト」とは集積回路の露光用フォトマスクのための設計図を生産工場に送ったことを意味する。AMDが既に生産し組み立てられた「Bulldozer」プロセッサのサンプルを受け取ったか、少なくともGlobalfoundries(※AMDの半導体生産工場会社。複数の資本が参加している)から半導体ウエハースを製造したかどうかという点ははっきりとしていないが、AMDは火曜日には最初の「Bulldozer」の性能に関連した声明を発表するとしており、その時がおそらく最初のサンプルを手に取る時であろうと思われる。

—-

そろそろBulldozerの性能に関する新しい情報が出てきそうである。たのしみ。

AMDの「Ontario」大量生産が今四半期に開始される?

xbit AMD’s Ontario Mass Production Set to Begin This Quarter – Rumours. Manufacturing of AMD Ontario Chip May Play Significant Role in TSMC’s Sales より。

うわさ AMDの「Ontario」大量生産が今四半期に開始される

AMD Ontarioチップ製造はTSMCの売上に大きな役割を演じるであろう。

AMDによる「Ontario」APU(Accelerated Proccessing Unit)はTSMC(Taiwan Semiconductor Manufaacturing Company)により今四半期の出来るだけ早いうちに始まるであろう。

「Commercial Times」新聞の記事によると、2010年の後半にTSMCのビジネスの結果に大きな役割を演じるよう計画された低消費電力のノートPCやネットブック向けに設計されたコードネーム「Ontario」プロセッサの生産から売上を挙げるだろう。

AMDの幹部からのコメントを元に、新聞記事は世界で2番目に巨大なCPU製造会社は「Ontario」APUを2010年の第4四半期につくり始めるだろうと予測した。

チップ設計側はコードネーム「Ontario」APUを元にした実際のシステムを来年のできるだけ早い段階で可能にすることを期待している。

残念なことに、それらのデバイスは革新的で技術的な傑作にならないであろうが、むしろ平凡で低価格なネットブックにDirectX11グラフィクスをサポートするのと同様に、改善されたパフォーマンスのマイクロプロセッサをもたらすであろう。今現在そのような特徴を備えたネットブックは存在しないが、小さなスクリーンのネットブックに先進的なグラフィックスを要求されるかどうかははっきりしない。

AMDのコードネーム「Ontario」は「Bobcat」マイクロアーキテクチャをベースにした二つのx86コアとDirectX11クラスの統合グラフィクスコア、DDR3メモリコントローラのシステムを一つのシリコン(SoC – System on chip)に搭載していることを特徴としている。以前の報告によると、「Bobcat」マイクロアーキテクチャはx86-64(AMD64 64ビットサポート)、仮想化技術、SSE、SSE2、SSE3テクノロジーをアウトオブオーダー実行機能によるシングルスレッド動作を特徴とし、それらはデュアルコアチップで、今日のメインストリームの性能の90%を半分以下のダイ面積で可能にする。AMDは「Bobcat」ベースの製品は1W以下で動作する能力を有していると主張する。そのSoCはTSMCの40nm製造プロセスを使って造られるだろう。AMDの「Ontario」は低消費電力デバイスのためのプラットフォーム「Brazos」のキーの一つである。

なおAMDは新聞記事に関してコメントしなかった。

噂ではTSMCの40nmプロセスの生産ラインはnVidiaとラインを取り合ってる状況のようだが、新しいTSMCの工場「fab15」は2年後の2012年に完成予定。AMDは毎度供給力に問題を抱えているのでどうなるか。

nVidia PC版PhysXはわざと遅く動作するようコンパイルされている

2ちゃんねる自作版Geforce葬儀場スレより。

下記サイト参照(英文)。
http://techreport.com/discussions.x/19216

http://www.semiaccurate.com/2010/07/07/nvidia-purposefully-hobbles-physx-cpu/

http://realworldtech.com/page.cfm?ArticleID=RWT070510142143&p=1

要点は、ゲーム内で様々なものの動きをリアルに表現する物理演算エンジンで、nVidiaが2008年に買収したPhysXが意図的にnVidiaハードウエア以外では遅く動作するようコンパイルされているとの情報。

・PC版PhysXはCPUを用いる場合いまどきシングルスレッド動作。
・GPUが無い場合x87浮動小数点演算機能(オプコード)を大量に使用している
・この機能は既に古臭く、5年前からAMDはSSEを使用することを推奨している
・SSEを使用すると容易にx87浮動小数点機能より1.5~2倍速くなる
・PC版PhysXではSSEを使用していない
・コンソール向けゲームではPhysXはPowerPC AltiVecインストラクションを使用している。
・PowerPC AltiVecはSSEに非常によく似たコマンド群。
・PC版PhysXはシングルスレッドでさえ2倍遅くなるようされている。
・nVidiaが怠けているのには、CPUに比べてGPUを使用したPhysXにパフォーマンス的に優位に見せるよう嘘をつくため。
・PhysXロゴはnVidiaのハードウエアがゲーム上アドバンテージとしてセールスポイントにする意図があるが、nVidiaのハードウエア以外すべてで遅くなる。

さらにSemiaccurateでは「CPUをマルチスレッドかつSSEをフル活用するとGPU単体より最大16倍w速くなる」とのこと。

ちなみにPhysXを開発したAGEIA元社長はnVidiaからAMDに移籍している。