AMDの公式ブログで「Bulldozer」の20の質問パート2 バカ訳すみません

AMDの公式ブログで「Bulldozer」の20の質問パート2

  • 同じモジュール内でコア同士の「プログラム可能な」同期機能はある?またもし自分のマルチスレッドアルゴリズムを互いのスレッドに近いペアを組むことで性能を上げることはできるの?
    – Edward Yang

    • うん、良い質問だ。
    • 基本的にはOSがスレッドのスケジュールを管理する。WindowsやLinuxなら効果的にBulldozerのコア間のスケジュールをこなすよ。
    • OSは最高性能か最高ワットパフォーマンスのどちらを優先させるかでコア性能をブースとさせるよ。
    • だけど違うモジュールで最高性能をだすために自分でスケジューリングできるよ。
    • 二つの整数演算コアは完全に別れており、実行パイプラインはL1キャッシュではデータ共有されない。これはソフト側で最適化する必要はないから。
    • L2キャッシュは二つの整数演算コアで共有されており、同時に実行パイプラインから読むことができるが書込はどちらか一つのみなんで注意ね。
    • ということは、二つのスレッドが共有するL2キャッシュにフィットするようなデータを自分でセットすることが可能。これで性能がより向上するだろう。
    • 忘れないでほしいのは他のコアのこと。データ共有のメリットと次の実行可能なコアにデータを送るためのメリットを天秤にかける必要があるよ。
    • 通常すぐに実行可能なスレッドの側に次のスレッドを準備しておくことが良い。
    • もしマルチスレッドアプリケーションがL2キャッシュ向けに最適化していないかL3キャッシュ向けに最適化している場合、はっきりとスレッドを分けたほうが良い。努力しない方がいいよ。そうしなくてもスケジューラが最適に実行するから。
  • Bulldozerで違うモジュールの二つのコアで実行する場合と同じモジュールで二つのスレッドを実行する場合どのくらい性能がアップするの?
    – Simon

    • Hot Chip22でプレゼンした資料を見て。CMP(Chip MultiProsessing 複数のコアチップを一つのコアに納めた単純な方法)と比較して、二つの整数演算コアでの性能は大体80%向上する。
    • けどこれはリソースを共有しているから出せる性能。
    • CMPはいくつか欠点があり、それは熱とダイサイズが大きくなること。そのため性能が消費電力により制限されてしまう。
    • 簡単に考えて、4シリンダの300馬力と6シリンダーの360馬力のエンジンではどちらが排気ガスが少ない?
    • シリンダーあたりの馬力比は、75馬力/4シリンダーと60馬力/6シリンダーとなり、4シリンダーの方がシリンダーあたりの性能が高い。
    • けどエンジン全体で見ると、4シリンダのエンジンは低い性能で高いコストになり、より排気ガスが多くなるよ。
  • 現在IntelのNehalem EXベースの8ソケット64コアサーバをIBMとHPが出しているよね。Bulldozerベースのサーバではスケーラビリティをどのように出すことができるの?
    – David Roff

    • Bulldozerは現在の「Maranello」「San Marino/Adelaide」プラットフォームに適しているね。
    • 「Maranello」は4CPUをサポートしている高性能プラットフォーム。
    • 「Maranello」プラットフォームと16コア「Interlagos」プロセッサを組み合わせると4ソケット×16コア=64コアになるよ。
    • IDCによると、8ソケットのx86プラットフォーム市場は26%落ち込んでいる。
    • 2009年が不況だからだというなら、2007年や2008年の8ソケットx86プラットフォーム市場と比べると横ばい。
    • すなわち市場は成長していないんだよ。この事は結構市場にインパクトを与えられるんだよ。
    • 8ソケット64コアではメモリ搭載に必要な面積が大きくなるが、4ソケットだと低価格で小さいサイズ、低消費電力になる。
    • Bulldozerは2011年にこれを実現するからよろしくー。
  • 性能を見る限りだと、Bulldozerは一般・ビジネス向けCPUに求められる消費電力制御を持っていない様に見えるよ。現在のマルチコアユーザが乗り換える意味のある新しい特徴はないの?Bulldozerが現在ビジネスに求められている新しい消費電力削減機能を細かく説明できる?
    – Jeremy Stewart

    • 「Maranello」プラットフォーム向けの現在出荷中のOpteron 6100シリーズにBulldozerが備えている電力削減機能は既に組み込み済み。
    • 既に公式ブログには書いたけど、現在のマルチコアプロセッサの水準を上げる性能を提供するよ。
    • 私たちは動的共有及び動的リソース配分を備えた消費電力に効果的なマイクロアーキテクチャを実装しているよ。高速なクロックとパワーゲーティングを活用してね。
    • プロセッサのチップレベルのコアパワーゲーティングをサポートしているよ。
    • そのOpteron6100の新しい技術はPowerNow!やCoolCore、低電圧DDR3メモリサポートで非常に良い感じ。
    • 33%のコア数増加とより大きなキャッシュで、現在の我々の12コアプロセッサと同じ消費電力なんだよ。

—-

Nehalem EXの言い訳は苦しいな、AMDw。あとJeremy偉そうだぞ。謙虚に質問しろよ。

IntelのSoC・サーバ関連主席研究員のDonald Newell氏をAMDのバイスプレジデント及びCTOに任命する。

xbitlabs.com AMD Appoints Ex-Intel Veteran as Server Chief Technology Officer. Ex-Intel Executive to Define AMD’s Server Roadmap [08/23/2010 06:37 AM] by Anton Shilov より。

AMDは前IntelのベテランをサーバCTOに任命する。

前のIntel幹部がAMDのサーバロードマップを決定する

by Anton Shilov

2010年8月23日

AMDは2010年8月23日月曜日にDonald Newellをヴァイスプレジデントおよびサーバビジネス部門のチーフテクノロジーオフィサー(CTO)として任命すると発表した。Donald NewelはAMDのサーバ向け製品のロードマップを決定する手助けを行ない、シニアバイスプレジデントおよびAMD製品グループのジェネラルマネージャであるRick Bergmanの部下となる。

「Don Newellはシーダーシップスキル、エンジニアリング及び設計の専門分野そして戦略の方向性を力強く結合させることとができる。私たちは幸運にも2011年ローンチを予定している私たちAMDのOpteronプロセッサである『Bulldozer』コアを出荷する準備を行う際にDon Newellを役職にそえることが出来た。』とBergman氏は述べた。

AMDのサーバCTOとして、Newell氏は現在の状況や長期のサーバ需要やトレンドを基にAMDの長期サーバーロードマップの構想及び定義付けを行う能力がある。彼は複数の世界規模のチームを率い、並行して他のAMD設計及び開発チームと設計から市場供給までの段階の流れに成功を保証する仕事を行う。

彼の16年間のIntelでの仕事の間、Newellはクラウドコンピューティングからハンドヘルドデバイスに及ぶ広大な範囲のSoCおよびサーバプラットフォームアーキテクチャ革新を率いてきた。NewellはまたI/Oアクセラレーション技術(IOAT)を初期の調査から製品の一片までを着手から駆動させるまで行ない、ヘテロジニアスコンピューティングの詳細なアーキテクチャを開発し、PC業界で最初のデジタルTV受信機を提供する能力がある。彼は彼のチームと共にキャッシュQoSやネットワークプロトコル制御のような先進的な論文を発表したことがある。Newell氏は60以上もの論文誌のピアレビュー(※査読)を行なっており、インターネット上での動画転送について記述されているIETF RFC2429の共同執筆者でもある。Intelに所属するのに先立って、彼はDatanex Softwareの最初のソフトウエアエンジニアであり、最近までSequent Computersに所属していた。Newellはオレゴン州率大学の科学学士を受け取った。

20以上の特許を取得している際立ったエンジニアであるNewell氏はAMDの所属する前にIntelの研究所でSoC及びデータセンターネットワークアーキテクチャグループのシニア主席エンジニアに席を置いていた。

—-

IntelといいnVidiaといい流出した人材の受け皿だな、AMDは。これでOpteron関連の出荷問題などを解決に導ければ経営も安定していくだろう。

AMDのサーバ向けCPU市場シェアが下落する : 最新のOpteron6000シリーズ出荷遅延により

The Inquire Intel grabs some of AMD’s server share It wasn’t using that, it seems By Ed Berridge Thu Aug 19 2010, 10:14 より。

概要として、

  • IDCによると、サーバ市場におけるシェア率についてIntelはAMDからいくらか奪還した。
  • すべての原因は、AMDが最新のOpteron6000シリーズの出荷速度が遅いということと、Intelのチップの方がearly adopters(※マーケティング用語。初期採用者)に先に製品を届けられたから。
  • Intelは2010年第2四半期で93.5%のサーバプロセッサ市場のシェアを獲得し、去年の同時期の89.9%に比べて上昇した。
  • それに応じてAMDの市場シェアは10.1%から6.5%に滑り落ちた。
  • AMDが第1四半期から第2四半期にかけて市場シェアを失った理由のほとんどはAMDの新しいOpteron6000シリーズを素早く出荷できなかったことである。
  • IDCはAMDがそれらの出荷問題が過去にも起きているという。
  • AMDはサーバ、デスクトップ、モバイル向けを含む巨大なx86アーキテクチャプロセッサ市場をつかんでいるが、市場全体でのプロセッサ出荷数はは2010年の第1四半期から第2四半期にかけて18.8%から19.0%に上昇した。
  • あなたはほんの少しだけAMDのノートPC向けチップ出荷により2010年第1四半期の12.1%から第2四半期の13.7%への上昇分があると見て取れるだろう。その間Intelの市場シェアは87.8%から86.1%へ下落した。
  • 最後にIDCはIntelはデスクトップ向けチップの市場シェアが第1四半期から0.5%上昇し72.2%となったと発表した。

—-

いつものAMD。どうしてもIntelに生産設備規模に対抗できないため商機を逃すというK6-IIIなど過去にもあった状況。CPU市場全体ではAMDが少しだけシェアを増加させたニュースが先日流れていたが、ノートPC向けでシェアをとったらサーバ向けでシェアを落とすというシーソーゲームのようだ。まさにIntelにとって生かさず殺さず。

SAMSUNGのハードディスクHD103SIが故障

Ubuntu Linux 10.04 Lucid Lynx + Promise Supertrak ex8350でSoftwareRAIDを構築しようとしたところ、RAIDボードからビープ音が鳴った。確認すると、2009年5月に購入したハードディスクHD103SIに大量のリードエラーが発生。

badblocksコマンドを利用して不良セクタを確認したところ532セクタでエラー発生。フォーマットも途中でリードエラーとなり完了できないのでCFD行き。

立て続けにハードディスクが故障するのはKEIANの電源のせいだろうか。次ハードディスクの故障が発生したらサーバの電源をSeasonicへ乗り換えよう。