AMDの次世代GPUの「Barts」のメモリコントローラについて妄想してみる

semiaccurate.com Northern Islands Barts benefits to moar, bigger? by Stephen Werner September 20, 2010 より。

概要は下記の通り。

  • AMD Radeon HD6770について非常に期待されているが、いったいどのくらいの価格帯なのか?
  • Radeon HD6770もしくは「Barts」は256bitメモリインターフェースと噂されているが従来のRadeonの価格帯では128bitが通例だった。
  • 製造コストを上げてまでAMDは256bitを採用するのか、HD5770「Juniper」の2倍の帯域が必要なのか見ていこう。
  • まずはRadeon HD5770のGPU動作周波数とメモリ周波数を調整する。Crysisと3DMark Vantageの数値から見ていく。実際にはDDR5のECCによる帯域への影響が結果として出るかもしれない。
  • メモリクロックをテストが失敗しない数値まで増加させた。結果数値は動かない。ベンチマークを他の日にもう一度動かしても数値は動かないので結果には自信がある。

Vantageは8.3%のメモリクロックまでで不具合を起こした。 **全体の合計より大きい点に注意

  • これらのテストではAMD PhenomII X4 3.2GHz、4GBメモリ、Windows7 64bitを使い、CPUのボトルネックが発生していないことを似たようなベンチマークを使って確認している。
  • 結果GPUのオーバークロックはメモリのオーバークロックより効果的であり、DDR5のECCによる帯域への結果は出ていない。結果として合計で35%の性能向上ができた。
  • 興味深い点はCrysisのスコアである。GPUとメモリのオーバークロックは個別にオーバークロックしたときの合計よりも性能向上につながる。
  • この結果からHD5770はバランスの良い製品であるという明快な結果が出た。

他のGPUでも試す。

  • HD4890は二つのチップを載せているが、DirectX11対応ではない。もちろんメモリコントローラも既に古い。
  • 理論的にはHD5770とHD4890の間にはメモリ帯域により20%の性能差がある。
  • HD4890をだしたのはメモリコントローラの違いを測定するためではなく、メモリ帯域がHD5770の76.8GB/secに対して124.8GB/secと67%大きい点で比べた。
  • 注意して表の数値を比べてみて欲しい。二つのGPUボードには20%の性能差がある。

  • 興味深い点はHD4890のメモリ帯域により性能が100%拡大しているわけではないところである。それでも30%〜40%の性能向上は見られるのだが、HD4890はHD4870よりメモリは遅い。
  • HD4870はHD5770より50%もメモリ帯域が大きいが、これ以上速いメモリが必要ではない。よってメモリを速くしても少ししか性能は上昇しない。
  • 更にnVidia Geforce 9600GTと9800GTで比較する。両方とも256bitメモリコントローラである。スペックか下記のとおり。

  • 9800GTは9600GTにほとんどの点で優っており、9800GTのテクセルフィルレートや浮動小数点演算能力は9600GTに比べ62%も上である。
  • メモリフィルレートは9800GTと9800GTXはほぼ同じである。
  • 一般的に9800GTは9600GTより15%性能が上であり、その結果メモリの帯域上昇による全体の性能上昇は小さいことがわかる。

メモリ帯域増加によるコスト

  • X-bit labsはRV770のメモリコントローラサイズを4,000万〜4,500万トランジスタと計算している。これはRV770の全体のトランジスタ数の5%未満である。
  • RV770とJuniperは似ている点があり、メモリ帯域が増加することによりトランジスタ数が増加していない点である。
  • この意味はJuniperのメモリコントローラが2,200万トランジスタか全体のトランジスタ数の2%前後であることがわかる。
  • ダイサイズに何が占有しているかはわからないが、一般的なメモリコントローラのトランジスタ密度を知らなくてもある程度のトランジスタ数を見積もることができる。
  • ポイントとして、「メモリコントローラーは128bitと256bitでダイサイズの影響は殆ど無い」ということである。
  • ダイサイズのコストはその大きさが小さくなると歩留まりが少しだけ上がる。もしPCB基板のコストが1層あたり10ドル上がるとした場合、コストの大半はPCB基板が占めるだろう。
  • 9800GTと9600GTを比較することにより、シェーダ数とテクスチャユニット数が性能向上に有効な点がわかる。メモリコントローラを2倍にしてもダイサイズ上では2%〜10%の間に留まるだろう。
  • シェーダ数とテクスチャユニット数の増加は性能向上もあるがダイサイズを大きくしてしまう。だがほとんどのコストを占めるPCB基板のコスト上昇は抑えられる。
  • 数多くの選択肢からどの道を行くのかを決めており、AMDとnVidiaは自身のパートナーの粗利を壊すことなく自身の粗利を確保しているだろう。
  • 歩留まりは予測され決定される必要があり、適切なコストは目標としている性能カテゴリの主要な要素であり、バランスが必要である。

「Barts」は256bitメモリコントローラか否か

  • 「Barts」の競合製品が何であるか思い出すことは非常に重要だ。それはnVidia Geforce 460GTXで、「256bitメモリコントローラ」を持っている。
  • AMDがそのような製品に128bitメモリコントローラを採用した製品で競争することは無いだろう。
  • 「Cayman」シリーズのDDR5メモリコントローラが「Barts」の1,600MHz(x4)であり、25%しかメモリ帯域が大きくない点がそれを示している。
  • もし40%以上のメモリ帯域を上乗せしても全体の性能は10%未満であろう。
  • 256bitメモリコントローラは確かに20%の性能向上をもたらす。
  • ただ確かな点は「Barts」は他のアーキテクチャ改善を行っているだろう。より多くのメモリ帯域は性能向上を提供するが、GPUとメモリクロックを一緒に上昇させたときの素晴らしい性能向上を思い出して欲しい。

最後に誰もが新しいアーキテクチャはダイサイズが小さくなるとメモリ帯域の制限により性能が制限されてしまうだろうと思うが、より大きなメモリコントローラは「Barts」シリーズに性能改善の多大なる貢献をするだろう。

AMDは同意しているかって?あと数週間でわかるよ。

—-

とりあえずスケジュールがHD5000シリーズ時より1ヶ月遅れているようなので2010年10月頃発表・月末販売開始か?

Adobe FlashのLinux 64bitサポートが再開されるが再生支援機能は使えず – フリーのGnashとLightsparkは絶賛対応中

Adobe FlashのLinux 64bitバージョンのサポートが再開される。

phoronix.com 64-bit Adobe Flash Linux Support Is Back Posted by Michael Larabel on September 16, 2010 より。

2010年初頭にAdobeは64bit LinuxでのFlash Playerサポートを止めるという幾分奇妙な決定をしたが、現在彼らは64bitバージョンのLinux、Mac OS X、Windowsの各OS用Flash Playerのリリースを再開した。

Adobe Labs経由のリリース情報によると、現在コードネーム「Square」と呼ばれている次世代Flash開発のマイルストーンバージョンはx86 64bit上で動作するWindows/Mac/Linux OSと64bit対応ウェブブラウザにネイティブサポートを提供する。

現在Flash「Square」マイルストーンバージョンが提供するその他の特徴は、つい最近ベータバージョンとしてリリースされたMicrosoft Internet Explorer9でサポートされたハードウエア支援機能が追加されたWindowsバージョンのみである。Adobe Flash Player Linuxバージョンは何のハードウエア動画再生支援機能も無い状態が続いている。AdobeのリードLinuxエンジニアはLinux video APIについて大言壮語を吐いたが、使用するのに適切に見えるVA-APIもしくはVDPAUインターフェース経由のサポートは結局未だに実現されていない。

この興味深い新しいAdobe Flash beta for x86/x86_64 LinuxバージョンはAdobe labsから見つけてダウンロードできる。またGnashLightsparkはFlash/SWF形式再生の代替ソフトウエアとして存在しているが、双方とも64bit LinuxやVA-APIを利用したハードウエア動画再生支援機能がハードウエアとデバイスドライバによりサポートされている。

—-

ワロタw オープンソースのFlashプレイヤーであるGnash 0.8.8はVA-API対応やFFmpeg、GStreamerの切り替えに対応し、Youtube完全対応しているのにw

AMDの「Zacate」プラットフォームのベンチマークは、Intel Core i5 GPUの2倍以上速い 更新 2010年9月15日

AMD Benchmarks Zacate APU, 2x Faster GPU Performance than Core i5 by Anand Lal Shimpi on 9/13/2010 11:06:00 PM より。

AMDの「Zacate」プラットフォームのベンチマークは、Intel Core i5 GPUの2倍以上速い

By Anand Lai Shimpi
2010年9月13日

AMDはIntelのIDFの間、身内だけのミーティングを開催し、今年も例外ではない。私はAMDのサーバやデスクトップ及び間近に迫るモバイル向けFusionローンチについていくつかを聞いた。私たちは詳細を聞く前にAMDの3つの新しいマイクロプロセッサについて聞いた。「Bulldozer」はハイエンドデスクトップ及びサーバ市場に2011年中(参考として第4四半期)に投入される。「Llano」は2011年のダイ2四半期の終り頃登場し、32nmプロセスのPhenomIIベースのマルチコアとAMDのDirectX11にしっかり対応したGPUとペアで登場する予定である。私たちが最も興奮したことは、2010年第4四半期に出荷される予定のメインストリームノートPC向け「Zacate」(TDP 18W)および「Ontario」(TDP 9W)である。

二つのAPUは低消費電力「Bobcat」コアにAMDのDirectX11 GPUと一緒に提供される予定である。AMDは公式にはGPU側がいくつのコアと組み合わされているか公表していないが、二つのダイはTSMCの40nmプロセスにより生産される予定である。そのパッケージはとんでもなくコンパクトである。

ダイサイズが非常に小さい。私たちが見るに74mm^2以下ではないか。チップの裏側は、あまり多くないボール数を見ることができる。

このシンプルなパッケージは可能な限り簡単に製造できるよう設計されている。パッケージの少ないボール数はこのパッケージがシングルチャネル 64bit DDR3メモリインターフェースであると暗に示している。だけれどもAMDの9W「Ontario」は明確にネットブック業界のIntel ATOMの後釜を狙っている(ATOMのインオーダ型と違い「Bobcat」のアウトオブオーダ型アーキテクチャは性能向上の成功を約束する)。「Zatate」は500ドル前後のメインストリームノートPC向け市場を目指している。AMDの提供したポイントは、Intel Core i5ノートブックと「Zacate」テストプラットフォームでゲーム「City of Heroes」を同じセッティング(1024×768 low quality)で動作させていた。

Intel Core 5iノートブックは14〜19FPSで動作していた。「Zacate」プラットフォームはより良い動作であった。

私が見たところ「Zacate」は27〜34FPSの性能だった。これはIntel HD Graphicsのほとんど2倍の性能である。「Zacate」は私たちが「Sandy Bridge」でみたものと同様の性能向上を果たしているように見える。確かにこれは「Sandy Bridge」のベンチマークではないが、基本的な性能アドバンテージは約束する。

AMDはまた二つのプラットフォームのInternet Explorer9(以下IE9)のベンチマークを用意し、その性能アドバンテージは明快であった。

IE9の電子ブック表示・ページめくりテストは2倍以上の性能改善が見られた。GPUをフルに活用したHTML5テストのPsychedelicベンチマークでは、完全に公園の外までノックアウトされてしまった。

AMDは私たちが満たハードウエアは2010年末に登場しシステムは1011年第1四半期には販売されると確約した。私たちはmini-ITXボードが同じ場所に置かれていたが、基本的な目的メインストリーム向けノートPC及び500ドル以下に価格が下がっているネットブック市場セグメント全体に当てることである。AMDはまた8時間以上のバッテリ駆動を設計にいくつか盛り込んでいることを約束したが、それはMobileMarkの数値であった。そのベンチマークは負荷率が低いのだ。

性能は完全に約束する。もし私たちがネットブックでグラフィクスの性能を見比べたのなら、私はそのフォームファクターが生き返るだろうと考える。

「Zacate」に付け加えるのなら、私たちは「Bulldozer」とAMDの「Northern Islands」GPUのローンチ情報の更新を行うだろう。そしてまもなく私たちは年末になる前にそのことについて聞けるだろう。いまはそれまで、今夜のIDFの報道から予測できるだろう。

—-

IDFの情報は他でたくさん書かれるからそれ以外を備忘録として載せておく。なお一部画像vr-zone.comより。

更新 2010年9月15日

anandtech.com AMD’s Zacate APU Performance Update by Anand Lal Shimpi on 9/15/2010 5:04:00 AM より。

Intel Core 5iの最新ドライバを導入した際のベンチマークがアップデートされている。

IE9のPhychedelicベンチマークではCore 5iが1774とZacateの1769を超えている。

またIE9のフレームレートもCore 5iが51fpsとZacateの47fpsを超えている。

あとはゲームのベンチマーク。


Zacate


Core 5i

Batman Arkham Asylum, FRAPS Walkthrough, 1024 x 768 High Quality

  • Zacate : 16.5 fps
  • Core 5i : 11.3 fps


Zacate


Core 5i

City of Heroes, FRAPS Walkthrough, 1024 x 768 Low Quality

  • Zacate : 39.6 fps
  • Core 5i : 25.5 fps

最後にDirectComputeのデモN-Body Simulationを。どんな計算かは「N体問題」で検索するといいかも。


Zacateの画像のみ

N-Body Simulation, DirectCompute Performance

  • Zacate : 23 GFLOPS
  • Core 5i : 8.8 GFLOPS

まあオフィススイート関連では僅差ながらCore 5iの新ドライバでZacateより性能が向上していることがわかる。ゲーム関連や演算性能そのものはZacateに軍配が上がるということか。

うわさ ZFSのNative Linux moduleをインドの会社が2010年9月にリリースする?

phoronix.com Native ZFS Is Coming To Linux Next Month Published on August 27, 2010 Written by Michael Larabel より。

概要として、

  • Sun microsystems(現Oracle)がSolaris用に開発していたZFSが来月にはLinuxでNativeで動作するかも。
  • ZFSはSolarisの他に、OpenSolaris FreeBSD NetBSDにCDDLライセンスで提供されている。
  • だが、CDDLはLinuxカーネルのGNU GPLと相容れないためmainline kernelに統合はできなかった。
  • だけど2010年9月にはZFS moduleとしてFUSE無しで公にリリースされるだろう。
  • FUSEはユーザサイドでファイルシステムを動作させる際に有用で、既にZFS on FUSEがLinux向けに提供されている。
  • だがZFS on FUSEは性能面でどうしても劣ってしまう。
  • ちなみにアメリカのローレンスリバモア国立研究所ではLinuxのZFS Naitve実装されたポートがあるが、オープンソースではない。
  • KQ Infotechというインドの会社がNative ZFS Linux moduleを開発している。
  • このKQ InfotechはCDDLのZFSコードを単純にLinuxに移植している。
  • まだOracleからは法的な面の追求は行なっていない様。
  • ローレンスリバモア国立研究所のポートとは異なり、KQ InfotechのZFSバージョンは、ZFS Pool 18である。これはdeduplicationサポートなどは無い。
  • KQ Infotechはまた2010年9月15日前後にソースコードをリリースするとしている。
  • 対応バージョンは64bitのみ。Fedra12及びRed Hat Enterprise Linux 6 Beta 2向けのRPMも提供する。
  • Ubuntu Linux 10.04 LTSもサポートされるが、カーネルのコンパイルから始める必要がある。
  • 最後にZFSをLinux moduleで動作させることは法的に衝突する運命であり、使用に制限がある。KQ Infotechのソースはディストリビューションベンダーには採用されないだろう。
  • KQ Infotechには新しいZFS Pool 21以上に対応させるかどうかはっきりとしない。
  • 数年後にはBtrFS(Oracle開発)などのZFSと競合する次世代ファイルシステムが登場するだろう。

—-
危なくて使えねぇ…。

ブラウザ Opera10.61 Linux版登場

opera.com よりダウンロード可能。Ubuntu Linux用.debパッケージもダウンロード可能。インストール後はメニューが正常に日本語表示される。ただしまだフォント設定が甘いのでこのあたりは各自でCSSを書き換えた方が良いだろう。

今まで問題であったibus-mozc等ibusでの日本語入力が可能になっている。この記事は実際Opera10.61 Ubuntu Linux版から掲載。

ただしYoutube等Flashプラグインも動作するが、amd64版ではoperapluginwrapper-nativeがopera起動時にsyslogに大量にSegment Faultログを吐き出す。

Jetway MA3-79GDG COMBO/DとUNITCOMノートPCのメモリ増設を行なった。

なぜか本文が消えている…。

さて妻が利用してるノートPCはUNITCOM製 Windows XP HomeのIntel Core Duo 1.6GHz 1GBメモリと標準的なスペック。オークション出品の関係上FirefoxやPhotoshop等を複数起動しながら利用しているが、最近はメモリ不足でハードディスへのページングが頻発していた。

そこでメモリを増設することにした。ついでに自分のVistaマシンのメモリをDDR2からDDR3 1333MHzに交換する。

UNITCOMノートPCのチップセットは「お嬢さん」の愛称で一部で有名なSiS製。メモリスロットは2個で、DDR2 SO DIMM 533MHzもしくは 677MHzの1スロット最大2GBユニットまで。標準では1GBメモリが1スロットに刺さっている。

購入したメモリはノーブランドのメモリだが、チップ名から台湾Jeylin製Zeppelineブランドらしいことはわかった。

ノートPCのバッテリーを取り外し、裏にあるメモリ増設用蓋を開けてメモリユニットをスロットに指す。そして起動してBIOS画面からメモリ容量を確認すると1GBしか認識していない。そこで電源を切り、メモリスロットを入れ替えるとちゃんと3GBと認識した。

Windows XP Homeでは十分なメモリ容量であろう。当分はこれでOK。

次にDDR3 SDRAM PC10600 1333MHz 2GB×2をJetway MA3-79GDG COMBO/Dに指す。

ここで注意点を。Jetway MA3-79GDG COMBO/DはDDR2メモリとDDR3メモリの異なる規格のメモリを排他利用できる変態マザーボードだが、使用するメモリによりBIOSが異なる。これまでDDR2メモリを利用していたので、DDR2用BIOSが起動していた。DDR2用BIOSはAMDの6コア対応BIOSにアップデートしているのだが、DDR3用BIOSはA02と購入時のまま。そこでBIOSのバージョンアップも同時に行う。

JetwayのサイトからDDR3用BIOSをダウンロードしUSBメモリにコピー。このUSBメモリはDOSが起動するようにしてある。

DDR3メモリとUSBメモリを挿して再起動。DOSプロンプトが表示されたのでflash.batを実行してBIOSアップデート。無事成功し再起動後にBIOS画面に入り、Optimize Loadを選んでSave&Exit。

Windows Vistaが無事起動したが、ブルースクリーン発生。3回ほどブルースクリーンを見たあと再度BIOS画面のDRAM関連の項目を確認するとめちゃくちゃな値が設定されていた。ちゃんと確認すべきだった。

BIOSのメモリ項目をすべてautoに設定すると安定して起動した。

これまで使っていたDDR2 1GB×2枚のメモリはUbuntu Linux amd64が動作しているAsus M2A-VMに指す。これでUbuntuは6GBメモリで動作することになり、VMware Playerを複数起動しても快適になった。

これで完了。