AMDの公式ブログで「Bulldozer」の20の質問パート2 バカ訳すみません

AMDの公式ブログで「Bulldozer」の20の質問パート2

  • 同じモジュール内でコア同士の「プログラム可能な」同期機能はある?またもし自分のマルチスレッドアルゴリズムを互いのスレッドに近いペアを組むことで性能を上げることはできるの?
    – Edward Yang

    • うん、良い質問だ。
    • 基本的にはOSがスレッドのスケジュールを管理する。WindowsやLinuxなら効果的にBulldozerのコア間のスケジュールをこなすよ。
    • OSは最高性能か最高ワットパフォーマンスのどちらを優先させるかでコア性能をブースとさせるよ。
    • だけど違うモジュールで最高性能をだすために自分でスケジューリングできるよ。
    • 二つの整数演算コアは完全に別れており、実行パイプラインはL1キャッシュではデータ共有されない。これはソフト側で最適化する必要はないから。
    • L2キャッシュは二つの整数演算コアで共有されており、同時に実行パイプラインから読むことができるが書込はどちらか一つのみなんで注意ね。
    • ということは、二つのスレッドが共有するL2キャッシュにフィットするようなデータを自分でセットすることが可能。これで性能がより向上するだろう。
    • 忘れないでほしいのは他のコアのこと。データ共有のメリットと次の実行可能なコアにデータを送るためのメリットを天秤にかける必要があるよ。
    • 通常すぐに実行可能なスレッドの側に次のスレッドを準備しておくことが良い。
    • もしマルチスレッドアプリケーションがL2キャッシュ向けに最適化していないかL3キャッシュ向けに最適化している場合、はっきりとスレッドを分けたほうが良い。努力しない方がいいよ。そうしなくてもスケジューラが最適に実行するから。
  • Bulldozerで違うモジュールの二つのコアで実行する場合と同じモジュールで二つのスレッドを実行する場合どのくらい性能がアップするの?
    – Simon

    • Hot Chip22でプレゼンした資料を見て。CMP(Chip MultiProsessing 複数のコアチップを一つのコアに納めた単純な方法)と比較して、二つの整数演算コアでの性能は大体80%向上する。
    • けどこれはリソースを共有しているから出せる性能。
    • CMPはいくつか欠点があり、それは熱とダイサイズが大きくなること。そのため性能が消費電力により制限されてしまう。
    • 簡単に考えて、4シリンダの300馬力と6シリンダーの360馬力のエンジンではどちらが排気ガスが少ない?
    • シリンダーあたりの馬力比は、75馬力/4シリンダーと60馬力/6シリンダーとなり、4シリンダーの方がシリンダーあたりの性能が高い。
    • けどエンジン全体で見ると、4シリンダのエンジンは低い性能で高いコストになり、より排気ガスが多くなるよ。
  • 現在IntelのNehalem EXベースの8ソケット64コアサーバをIBMとHPが出しているよね。Bulldozerベースのサーバではスケーラビリティをどのように出すことができるの?
    – David Roff

    • Bulldozerは現在の「Maranello」「San Marino/Adelaide」プラットフォームに適しているね。
    • 「Maranello」は4CPUをサポートしている高性能プラットフォーム。
    • 「Maranello」プラットフォームと16コア「Interlagos」プロセッサを組み合わせると4ソケット×16コア=64コアになるよ。
    • IDCによると、8ソケットのx86プラットフォーム市場は26%落ち込んでいる。
    • 2009年が不況だからだというなら、2007年や2008年の8ソケットx86プラットフォーム市場と比べると横ばい。
    • すなわち市場は成長していないんだよ。この事は結構市場にインパクトを与えられるんだよ。
    • 8ソケット64コアではメモリ搭載に必要な面積が大きくなるが、4ソケットだと低価格で小さいサイズ、低消費電力になる。
    • Bulldozerは2011年にこれを実現するからよろしくー。
  • 性能を見る限りだと、Bulldozerは一般・ビジネス向けCPUに求められる消費電力制御を持っていない様に見えるよ。現在のマルチコアユーザが乗り換える意味のある新しい特徴はないの?Bulldozerが現在ビジネスに求められている新しい消費電力削減機能を細かく説明できる?
    – Jeremy Stewart

    • 「Maranello」プラットフォーム向けの現在出荷中のOpteron 6100シリーズにBulldozerが備えている電力削減機能は既に組み込み済み。
    • 既に公式ブログには書いたけど、現在のマルチコアプロセッサの水準を上げる性能を提供するよ。
    • 私たちは動的共有及び動的リソース配分を備えた消費電力に効果的なマイクロアーキテクチャを実装しているよ。高速なクロックとパワーゲーティングを活用してね。
    • プロセッサのチップレベルのコアパワーゲーティングをサポートしているよ。
    • そのOpteron6100の新しい技術はPowerNow!やCoolCore、低電圧DDR3メモリサポートで非常に良い感じ。
    • 33%のコア数増加とより大きなキャッシュで、現在の我々の12コアプロセッサと同じ消費電力なんだよ。

—-

Nehalem EXの言い訳は苦しいな、AMDw。あとJeremy偉そうだぞ。謙虚に質問しろよ。

広告
コメントする

4件のコメント

  1. AMDの次世代CPU「Bulldozer」の詳細情報がHot Chip22で公開される。 « PCハードウエアとLinux情報 Leddownのブログ
  2. AMDの公式ブログで「Bulldozer」の20の質問パート3 懲りずにバカ訳 « PCハードウエアとLinux情報 Leddownのブログ
  3. AMDの公式ブログで「Bulldozer」の20の質問パート3 懲りずにバカ訳 « PCハードウエアとLinux情報 Leddownのブログ
  4. AMDの公式ブログで「Bulldozer」の20の質問パート3 懲りずにバカ訳 « PCハードウエアとLinux情報 Leddownのブログ

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。