AMDの次世代CPU「Bulldozer」ベースの「Orochi」ダイ写真&「LIano」ウエハース写真

semiaccurate.com AMD shows off Llano wafer GTC 2010: Briefly, but they are real by Charlie Demerjian September 1, 2010

semiaccurate.com AMD outs the Bulldozer based Orochi die GTC 2010: Second generation fusions abound by Charlie Demerjian September 1, 2010

semiaccurate.com More Llano wafer pictures GTC 2010: You asked for better, we deliver by Charlie Demerjian September 1, 2010 より。

これは「Bulldozer」ベースの「Orochi」ダイ写真。32nmプロセスで製造される。

「Llano」のウエハース写真。「Llano」はAMDのGPU統合型CPUであるFusion APUの第1弾。

写真の出典元: semiaccurate.com

AMDの次世代CPU「Bulldozer」の詳細情報がHot Chip22で公開される。

概要として、「Bulldozer」と「Bobcat」はx86コアを二つの市場向けにチューニングしている。

  • 「Bulldozer」は「Sandtiger」ミドルクラスサーバ・ワークステーション向けCPUから登場する予定。
  • 「Bobcat」はノートPCやクラウドコンピューティングのクライアント機向け。

  • 「Bulldozer」コアはモジュール形式。
  • 二つの4パイプラインコアが浮動小数点演算スケジューラと二つの128bitFMACを共有する。
  • 「Bulldozer」はGlobalfoundriesの32nm SOI技術により製造される予定。

  • 二つの4パイプラインコアが浮動小数点演算スケジューラと二つの128bitFMACを共有する。
  • IntelのシングルチップHyperThreadingよりスループットが向上。

  • これは今日のデスクトップでは浮動小数点演算のコード量は非常に少なく、共有浮動小数点演算スケジューラを導入することで消費電力を抑えることが可能。またダイサイズ減少に貢献している。
  • また二つの128bitFMACは組み合わせて256bitFMACとして利用可能。
  • 「Bulldozer」はダイナミックに各コンポーネントとの接続を切り替えることで最大限のワットパフォーマンスを実現。
  • それぞれのコアは共有L2キャッシュを搭載している。

  • それぞれのモジュールはHyperTransportバスを介して様々な構成のマルチコアプロセッサを組み上げることが可能。
  • 各コアは共有L3キャッシュと接続され、統合型メモリコントローラがその先に接続されている。

  • コアが33%増加すると50%性能アップ。これは同じ消費電力の現行CPU「Magny-Cours」(Opteron6000シリーズ)と比較した場合。
  • 2011年中に提供される予定。
  • 6000シリーズのサーバ向けプロセッサは12〜16コアで6〜8モジュール構成である。
  • 4000シリーズは4〜8コアである。
  • サーバ向けチップセットは現在の市場ではG34・C32ソケットを利用可能である。これらのプロセッサは置き換えるだけで性能向上やコア数増加が可能である。
  • 重要な強化点としてメモリコントローラが大幅なメモリ帯域増加を提供することである。

  • 2番目の整数演算コアを追加するのに全体の12%の回路のみで良い。
  • そしてチップレベルでは全体のダイサイズの5%の追加で可能となる。
  • また「Bulldozer」に内蔵されたデスクトップPC向けノースブリッジより低消費電力で発達し粒度の細かいクロックゲートを実現。
  • DDR3メモリが利用可能で、またAMDの「TurboCore」テクノロジによりプロセッサをオーバクロックさせるモードを搭載している。
  • デスクトップPC向けは4〜8コアの「Bulldozer」が採用されると予想される。
  • ソケットはAM3+となり、現行のAM2やAM3ソケットでは「Bulldozer」は対応しない。
  • なおAM2+、AM3 CPUはAM3+ソケットで利用可能。

  • AMD FusionAPU「Ontario」に搭載される「Bobcat」コアと接続図

  • ノートPC向け「Bobcat」コアはデュアルx86コアにアウトオブオーダ実行、低消費電力が特徴。IntelのAtomはインオーダ型。

IntelのHyperThreadingとAMD Modulesが競合技術になるのか。また現行のAM3では「Bulldozer」コアが使えないらしいので、新たなAMDチップセットが登場するかもしれない。

あと、AMD Hot Chip ニュースサイト向けプレスキットはこちらから。

追加でAMDの公式ブログで「Bulldozer」の20の質問ラウンド1が掲載開始。

  • いろんなコードネームのチップが合って混乱しているんだけどどうなの?
    • これ読んどけ。基本はコア数だ。
    • “Interlagos” – 16-core server processor
    • “Valencia” – 8-core server processor
    • “Zambezi” – 8-core client processor
  • Intelの製品と比べ、AMDの仮想化技術の利点は?
    • コア数で簡単に比較できるよ。Opteron6100を二つ使えばコア数は24個、なんで24VMが動作できる。
    • また共有L2キャッシュもいい感じ。
  • 「Bulldozer」とFusion APU「Ontario」は同じコアなの?
    • 違う。「Bobcat」コアをベースにした違う設計チップ。
  • 「Thuban」チップのように「TurboCore」に対応するの?
    • その通り。サーバ分野で初めて「TurboCore」を導入するよ。
  • 「Bulldozer」チップはサーバ分野ではどのようなインパクトがあるの?
    • いろんな視点があるけど、まずはモジュール構造の導入が挙げられる。
    • 他には性能向上と低消費電力。
    • また仮想化技術の一層の性能向上。

バカ訳ですみません。

続きのパート2はこちらから読めます

うわさ AMDの28nmプロセス使用のGPUはGlobalfoundriesとTSMCの両方を使う? ソース元Fudzilla

vr-zone.com [Rumour] AMD to use both Globalfoundries and TSMC for 28nm GPUs Published on Thursday, August 19 2010 7:18 pm by Sub より。

概要は下記の通り。

  • 今年初め、AMDのCEOのダーク・マイヤーは28nmのATI GPUの「最初の製品」は Globalfoundriesの28nmプロセス(※英文)で製造されるだろうと伝えた。
  • うわさではいまだ完全にGlobalfoundriesに移動する可能性かTSMCとGlobalfoundriesとの間で分けるか議論が続いている。
  • FudzillaではAMDのGPUはTSMCとGlobalfoundriesで28nmプロセスでの製造が行われているという記事を掲載した。
  • だがそれについては不自然な点がある。
  • 可能性が高いのは、AMDのフラッグシップモデルのチップ生産をリクスの低いTSMC 28nmプロセスで生産し、その後派生モデルをGlobalfoundriesで行うという場合である。
  • AMDはかつて似たような方法で製品を製造した。
  • その製品とはRadeon HD4770で、Radeon HD4000シリーズでリスクを背負うことなく、HD4770でTSMCの40nmプロセス製造問題を経験した。
  • Radeon HD5000シリーズでも同じ製造問題にあったが、経験を生かすことでIntelとの競争で生き残るための成功をつかんだ。
  • AMDが長期的にはGlobalfoundriesを利用していく心構えであることに疑いを持たないが、高性能のGPUを製造する前に新しい世代に移行するリスクを負いたくはないであろう。
  • 最近のうわさではAMDのGlobalfoudriesの28nmプロセスGPUは2011年の早い時期(※英文)だろうとしているが、Fudzillaは2011年末という独自のタイムラインを示している。
  • まあそれよりも前に、TSMCの40nmプロセスで製造されるnVidia Geforce GTX 400シリーズと「Southern Islands」GPU,そしてAMD Fusion APU「Ontario」が先に動き出すだろう。

参照元 : Fudzilla

—-

まあ、Fudzillaの飛ばし記事wであるという前提で読んで。そこからvr-zoneの記者は分析しているという内容。記事を読んだあとに新しいことは何も書かれていないという寂しい例だな、この記事は。

[Rumour] AMD to use both Globalfoundries and TSMC for 28nm GPUs

Published on Thursday, August 19 2010 7:18 pm by Sub

IntelがOpenCL向けSDKを年度末に発表 ただしCPUのみを利用する

hardware-infos.com Intel springt auf den OpenCL-Zug auf より。

概要は下記の通り。

  • Intelが自社製品向けにOpenCL SDKを2010年末に提供すると発表した。
  • OpenCLはKhronos Groupによって策定されたヘテロジニアスアーキテクチャ向けパラレルプログラムライブラリ
  • ヘテロジニアスシステムとは、CPU+GPUという異なるアーキテクチャシステムの組み合わせのこと。現在のPC向けCPUは、コア毎に機能に違いのないホモジニアスアーキテクチャ。
  • Intelは自社のCPU向けにAVXやSSEに対応させたOpenCL SDKを提供する。これで15%前後性能が改善する。
  • 現在IntelはCPUとGPUが連動したSDKは提供する意向は見られない。
  • だが疑問点として、Sandy BridgeのようなGPU統合型CPUでOpenCLを実行する場合はGPUの機能を活用するのだろうか?

—-

AMDはFusion APUでOpenCL環境を提供するといううわさがあるんで、Intelも時期が来たら提供はするだろうけど積極的に推進することは当面無さそう。

AMD/ATIのGPUシェアがnVidiaを追い抜く 更新2010年8月2日

cnet.com AMD tops Nvidia in graphics chip shipments

cnet.com Graphics chip market seeing big changes より。

  • Mercury Researchによると、2010年の第2四半期のディスクリートGPU市場において、AMDが51%、nVidiaが49%とシェアが逆転した。
  • なおGPU全体の市場ではIntelが54.3%、AMDが24.5%、nVidiaが19.8%である。昨年の同時期ではnVidiaは29.6%、AMDが18.2%であった。
  • その結果ディスクリートGPU市場でAMDが1位となり、nVidiaを2位に追いやった。

とうとうGPUボードのシェアがAMD/ATIとnVidiaが逆転した。Rambusの特許侵害による米ITCの輸入禁止の最終決定が下ったばかりなのに。具体的な数値がnVidiaの凋落を物語っている。nVidiaが8月頃にGF106を出荷する時期に、AMDはSouthern IslandsチップHD6000シリーズや、AMDのGPU統合型CPUデスクトップ版 FusionAPU「Ontario」の情報が出てくるだろう。

nVidiaは本業のディスクリートGPUを疎かにしないで、Tegraなんかにリソースを割いている場合ではないと思うが。AMDもサーバ関連はIntelに食われているので後に引けないのは同じか?

なお、xbitlabs.comにより詳細な内容が記事になっていた。

  • nVidiaの2011年第1四半期の総売上は10億ドル。
  • うち一般向け製品が7億8,090万ドル。
  • QuadroやTeslaなどプロフェッショナル向けが1億8,970万ドル。
  • Tegraやコンシューマゲーム機のロイヤリティが3,120万ドル。
  • nVidiaは経済問題とメモリコストの上昇が売上減少につながっているとアナウンスしている。
  • だが根本的な原因はDirectX11チップを一般市場に十分に供給できない点と、Fermiアーキテクチャの失敗にある。
  • AMDの売上増にはチップセット統合型GPUは含まれていない。
  • 一般向けコンピュータシーズンでは新学期(海外では9月が一般的)に向けて、appleがiMacでGeforce9400MチップセットではなくAMD Radeon HDに切り替えた。
  • nVidiaは急いでGF106やGF108などメインストリーム・エントリー向けのGPUを出荷すべき。
  • その間にAMDはHD6000シリーズを出荷するかHD5000シリーズをより多く揃えることができる。

Tegraはゲーム機のロイヤリティ含めても売上の3%・・・。

追加 2010年8月2日

各GPUメーカの2010年第2四半期マーケットシェアの概要を追加した。

Brief Graphics Market Overview for Q2 2010 – Market Shares in %
Data by Mercury Research
Overall Desktop Discrete Mobile Discrete Total Discrete
ATI/AMD 24.5% 44.5% 56.3% 51.1%
Intel 54.3%
Nvidia 19.8% 55.2% 43.7% 48.8%
Matrox <0.1% 0.3% 0.1%
S3 Graphics/Via 0.7%
SiS 0.7% 0

表の引用元はxbitlabs.comより。

うわさ AMD デスクトップ向けFusion APU「Zacate」が2010年第4四半期に登場?

vr-zone [Rumour] First AMD Fusion APUs in Q4 2010 より。

AMDのFusion APU「Ontario」は40nmプロセスの消費電力10W以内の低消費電力のCPUとGPUのハイブリッドチップだが、「Zacate」は消費電力10W〜23Wの範囲となる。本命のFusion APU「Llano」は消費電力10W〜100Wと可変するがこれはGrobalFounderiesの32nmプロセス問題により2011年登場にずれ込むとこれまで通り。

DellやHPの年末商戦向けに出荷されるのだろうか。

AMDの「Ontario」大量生産が今四半期に開始される?

xbit AMD’s Ontario Mass Production Set to Begin This Quarter – Rumours. Manufacturing of AMD Ontario Chip May Play Significant Role in TSMC’s Sales より。

うわさ AMDの「Ontario」大量生産が今四半期に開始される

AMD Ontarioチップ製造はTSMCの売上に大きな役割を演じるであろう。

AMDによる「Ontario」APU(Accelerated Proccessing Unit)はTSMC(Taiwan Semiconductor Manufaacturing Company)により今四半期の出来るだけ早いうちに始まるであろう。

「Commercial Times」新聞の記事によると、2010年の後半にTSMCのビジネスの結果に大きな役割を演じるよう計画された低消費電力のノートPCやネットブック向けに設計されたコードネーム「Ontario」プロセッサの生産から売上を挙げるだろう。

AMDの幹部からのコメントを元に、新聞記事は世界で2番目に巨大なCPU製造会社は「Ontario」APUを2010年の第4四半期につくり始めるだろうと予測した。

チップ設計側はコードネーム「Ontario」APUを元にした実際のシステムを来年のできるだけ早い段階で可能にすることを期待している。

残念なことに、それらのデバイスは革新的で技術的な傑作にならないであろうが、むしろ平凡で低価格なネットブックにDirectX11グラフィクスをサポートするのと同様に、改善されたパフォーマンスのマイクロプロセッサをもたらすであろう。今現在そのような特徴を備えたネットブックは存在しないが、小さなスクリーンのネットブックに先進的なグラフィックスを要求されるかどうかははっきりしない。

AMDのコードネーム「Ontario」は「Bobcat」マイクロアーキテクチャをベースにした二つのx86コアとDirectX11クラスの統合グラフィクスコア、DDR3メモリコントローラのシステムを一つのシリコン(SoC – System on chip)に搭載していることを特徴としている。以前の報告によると、「Bobcat」マイクロアーキテクチャはx86-64(AMD64 64ビットサポート)、仮想化技術、SSE、SSE2、SSE3テクノロジーをアウトオブオーダー実行機能によるシングルスレッド動作を特徴とし、それらはデュアルコアチップで、今日のメインストリームの性能の90%を半分以下のダイ面積で可能にする。AMDは「Bobcat」ベースの製品は1W以下で動作する能力を有していると主張する。そのSoCはTSMCの40nm製造プロセスを使って造られるだろう。AMDの「Ontario」は低消費電力デバイスのためのプラットフォーム「Brazos」のキーの一つである。

なおAMDは新聞記事に関してコメントしなかった。

噂ではTSMCの40nmプロセスの生産ラインはnVidiaとラインを取り合ってる状況のようだが、新しいTSMCの工場「fab15」は2年後の2012年に完成予定。AMDは毎度供給力に問題を抱えているのでどうなるか。

AMDのGPU統合型CPU「Llano」がプロセス技術問題で市場投入が遅れる

xbit AMD Delays Roll-Out of “Llano” Processor Due to Process Tech Issues.AMD Postpones Launch of Microprocessor with Integrated Graphics より。

AMDのGPU統合型CPU「Llano」がプロセス技術問題で市場投入が遅れる。

32nmの絶縁体上のシリコンプロセス技術問題が原因で、AMDは同じシリコンダイに統合されたGPUとハイパフォーマンスCPUが統合されたコードネーム「Llano」のローンチを遅らせねばならないとした。AMDは遅延は2ヶ月だと発表した。

「”Llano” – よりハイエンドなクライアントPC市場向けに期待されているFusion APU(Acccelerated Prosessing Units) – は、積極的な顧客の反応を生み出している。だがしかし、”Ontario”の好評な市場の反応を受けて、期待された32nmの歩留まりカーブより遅くなり、我々は”Ontario”と”Llano”の生産ラインのタイミングを切り替えている。”Llano”プロダクション出荷はいまだ来年の最初の半年以内にできると予想される。」

とAMDチーフエグゼクティブのダーク・マイヤーは金融関係者との会話の間で話した。

AMDはLlano APUを売上を上げるため既に公式に2010年の第4四半期に2011年内の非常に早い段階に出荷を始めると予測していた。これはAMDがLlanoの設計と32nmSOI製造プロセスを融合させる問題を有しているかどうかはっきりしない。Llanoの設計にいくつかの設計に欠陥を有しているかまたプロセス自身に問題がある。AMDによればいくつかのケースで、商用出荷開始が2ヶ月ずれたことがあると述べている。

「我々は32nmプロセスの歩留まり率を上げる計画を立てている。…私たちは32nmの歩留まり率カーブを上げるためにもう少しだけ作業する時間をとる。その影響はLlanoの内部計画を2ヶ月という期間に変更することにした」とダーク・マイヤーは述べた。

報告される前に、AMD Llano APUは各々9.69mm~2のダイサイズの現在のマイクロアーキテクチャ(L2キャッシュ抜き)をベースとした4つのx86コアを有し、350万トランジスタ(L2キャッシュ抜き)で2.5W〜25W消費電力で、0.8V〜1.3V電圧で3.0GHz以上の周波数をターゲットにしている。そのコアは周波数や電圧を設計された温度設計範囲内で、必要に応じてプログラムが4つのコアを必要としない時やリソースのために必要とされない消費電力を調整してパフォーマンスをブーストしダイナミックに性能をスケールする。似たような複数のニュースソースによれば、Llanoの異なるバージョンのハイエンド時のデュアルコアは20Wから59Wまで変化する温度設定能力を有し、3コアか4コアのTDP(設計温度計画)は35W〜59Wに収まる。4つのx86を二つ一緒にしたメインストリームコアチップは30W温度設計内に収まり、低消費電力デュアルコアLlanoチップは20W TDPに収まる。Llanoは32nm SOIプロセス技術を使って作られるだろう。

AMD「Sabine」プラットフォームはまたコードネーム「Hudson」PCI Express グラフィクスポートI/Oコントローラーを内蔵し、USB16ポート、USB 3.0サポート(Hudson M3のみ)、RAIDをサポートしたSATA6ポート、ギガビットイーサネット、統合ビデオDAC・クロックジェネレータなどを有する。それに加えて「Sabine」プラットフォームはまたオプションで「Vancouver」シリーズGPUサポートを特徴とする。

AMDのライバルであるIntelは、2010年の第4四半期に次世代グラフィクスコアを内蔵した「Sandy Bridge」プロセッサの出荷開始を計画している。

ありゃりゃ、GPUとCPUの統合「Fusion」を提唱したAMDがIntelに製品出荷の先を越されるとは。