Ubuntu Linux 11.04 Natty Narwhal へのアップグレード失敗について

日本時間の4月28日夜にUbuntu Linux 11.04 Natty Narwhal のダウンロード及びアップグレードが可能になったとの通知がupdate-manager経由で知った。早速update-managerを利用しアップデートしたが、

An unresolvable problem occurred while calculating the upgrade: E:Error, pkgProblemResolver::Resolve generated breaks, this may be caused by held packages.

というメッセージと共にアップデートが中断する。作業のログは /var/log/dist-upgrade/ 以下にディレクトリが作成されるので、apt.logというファイルを確認する。

  • xserver-xorg関連で大量に「Broken xserver-xorg-core:amd64 Breaks on xserver-xorg-video-8 [ amd64 ] < none > ( none )」などのメッセージが記録されている。

xorg-edgersのppaを利用しているせいだろう。次の作業を行う。

  1. sudo aptitude install ppa-purge
  2. sudo ppa-purge xorg-edgers
  3. sudo aptitude remove libdrm-* libgl1*
  4. sudo aptitude update
  5. sudo aptitude upgrade
  6. sudo do-release-upgrade

これで無事アップデート処理が開始された。

AMD Radeon HD6800ドキュメントがリーク – BartsがHD6800シリーズとなる?

vr-zone.com AMD Radeon HD 6800 Document Leaked Published on Friday, October 8 2010 2:59 pm by Sub より。

新たに登場する予定のRadeon HD6800シリーズのPDF概要ドキュメントのスクリーンショットがリークした。出典はIT.com.cnで、Chiphellが掲載した。だけれどもドキュメントは簡体中文であるが、いくつかもの詳細が暴露されている。たとえば命名体系やトレードマークの特徴などが英語で書かれている。予測されるRadeon HD6870の特徴はGDDR5メモリとPCI Express 2.1 x16をサポートし、DirectX11やEyefinityに加え、「EyeSpeed」と呼ばれる機能jが追加されている。UVD3も記載されているが、詳細は中国語である。意外ではないが、AMDはついにnVidia 3DVisionの代替技術を導入している。名前はAMD HD3Dである。そして極めて重要な情報がこの後記載されているが、Barts XTとはAMD Radeon HD6870であり、Barts Proは Radeon HD6850のことである。

噂では長い間Bartsはメインストリーム向けHD5700 Juniperの置換えであり、Caymanが性能重視のCypressの置き換え、dual-Caymanが高性能であるAntillesプロダクトであると信じられていた。これはBartsはHD6700、CaymanはHD6800、AntillesはHD6900であると論理的に導き出された結果である。BartsがHD6700の代わりにHD6800となるとしばらく噂が流れていたが、当初は高性能を重視する消費者によって無視されていた。だけれども、PDFドキュメントが正式なものであると仮定するのなら、もしBartsは実はHD6800であり、CaymanとAntillesはどの位置づけになるのだろう?確かに、CaymanはHD6850/6870になることが出来るが、Antillesについてはどうなるのか?そのスライドはまたAMDの命名他医系に衝いて言及しており、確実な接尾辞は「30」「50」「70」であり、HD6900は不確実である。それに加えこ噂のAntillles Proは事実ではない。そしてもしBartsがHD6800であり、この意味がHD5800より遅いのかかろうじて速いのだろうか?

明らかにいくつかの噂と数多くの相反する情報であり、多くのことが命名体系から推測する必要がある。

加えて、Chiphellの投稿者はHD6800の価格は300ドル未満であると強調している

参考元:Chiphell

Ubuntu Linux 10.10 Maverick Meeakat のアップデート失敗 – その後復旧

Ubuntu Linux 10.04から10.10にupdate-managerでアップデートを実行したが失敗した(スクリプトエラーを表示したままフリーズ)。その結果起動自体しなくなってしまった。

とりあえずシステムとデータの復旧は成功したので一安心。備忘録として手順をまとめておく。

  1. Ubuntu Linux 10.10のCDイメージをダウンロードしCD-Rに記録する。
  2. CDから起動後、通常のインストールに進み、partitionorの段階で既存のディスクにルートディレクトリとスワップ領域を割り当てる。
  3. Alt+ctrl+F2でコンソールを切り替え、/etcと/homeを別ディスクにバックアップする。
  4. またAlt+ctrl+F1でpartitionorに戻り、「パーティションをフォーマットしない」を選択する。すると/binや/sbin、/etcなどを削除するけど良いかと確認してくるのでOKする。
  5. しばらくインストールしリスタート。
  6. 無事起動するがRAIDやLVM設定ファイル等/etcディレクトリが標準に戻ってしまうので、ログイン後バックアップディスクからコピーする。
  7. 再び再起動すると起動時にRAIDやLVMパーティションを認識しfstabの記述通りにマウントする。
  8. 日本語パッケージのリポジトリなどを登録する。
  9. あとは足りないアプリケーションソフトウエアを追加インストールして完了。

さてASUS M2A-VMの環境で変化した点は、xorg Radeonデバイスドライバでcompiz-fusionが有効になるが、1920×1440以上の解像度では画面右端の表示が乱れる現象である。metacityでは発生しないのでmesa-driかxserver-xorg-video-radeonかどちらかの問題であろう。

 

nVidiaはCUDAのx86アーキテクチャへの最適化にほとんど興味がない – アナリスト談

xbitlabs.com Nvidia Hardly Interested in Optimal Performance of CUDA on x86 Processors – Analyst. Despite CUDA x86 Cross-Compiler, Life of Programmers Will Not Get Easier [09/28/2010 07:49 PM] by Anton Shilov より。

nVidiaはCUDAのx86アーキテクチャへの最適化にほとんど興味がない – アナリスト談

CUDAのx86向けクロスコンパイラに反して、プログラマの生活はより良くはならないだろう。
Anton Shilov
2010年9月28日

nVidiaとPortland Groupは先週nVidia CUDAアーキテクチャからx86へ、又は逆にx86からCUDAへソフトウエアを開発することができる特別なコンパイラを登場させた。これはソフトウエア開発者が彼らのプログラムに広く互換性を保証し、高並列GPUアーキテクチャを活用できることを提案している。だけれども、ソフトウエアメーカの生活はより良くなることはないだろうと、Jon Peddie ResearchのAlex Herreraは語った。

異なるアプリケーションのため、これらにはスーパーコンピュータ分野も含まれるが、より高い性能を照らす光明があるにもかかわらずATI RadeonやnVidia Geforceのようなグラフィクスプロセッサのために作り直されることはない多くの理由がある。主な理由の一つは、これまでも使われているレガシーなコードがあり、既に業務で使用されているためほとんどど捨てることができない。コンパイラはPGIとnVidiaが共同でソフトウエア開発者にCUDAベースのソフトウエアをx86プラットフォームにアプローチすることでテストしてもらいたがっており、信頼度を測ってもらいたがっている。それにもかかわらず、十分に安定して動作しているが、CUDAベースのソフトウエアのx86アーキテクチャでの性能はほとんど最適化されていない、とHerrera氏は主張している。

GPUベースのnVidia PhysXがそうであるようにCUDAもまたSSE2等のSIMDインストラクションをサポートしていない。新しいコンパイラはAMD BulldozerやIntel Sandy Bridgeマイクロプロセッサで使われる予定のAVXのようなものもサポートしないだろう。その結果、アプリケーションソフトウエアはx86プラットフォームでは最高性能を発揮できないだろ。

「x86で動作するCUDAはCUDAを使用しないでx86アーキテクチャに最適化されたアプリケーションソフトより遅くなるだろう。そしてx86で動作するCUDAアプリケーションやFermiで動作するアプリケーションを動作させる開発者は、最初に簡便に最適化できるCUDA無しのx86プラットフォームのほうが他のCUDAベースのアプリケーションよりも速く動作するのを目撃するだろう。より大きな性能向上によるベンチマーク数値はnVidiaが多くの浮動小数点演算を多用するアプリケーションソフトウエアでCPUよりもGPUのほうがより速いと宣伝する目的で使用されるだろう。」とアナリストは語った。

最後に、特定の目的および一般向け商用ソフトウエアの設計者は異なるハードウエアのために異なるコードを実装する必要が出てくるだろうし、いくつかは既に行われている。


開発側の負担が大きくなるだけで誰も得をしないということだな、nVidiaのCUDAは。あくまでも宣伝用でしか無いと。

スマートフォンはいずれx86 PCを葬るだろうとnVidia CEOは語る

xbitlabs.com Smartphones Will Bury x86 Personal Computers – Chief Executive of Nvidia.ARM Will Be the Most Important CPU Architecture – Jen-Hsun Huang [09/27/2010 10:15 AM] by Anton Shilov より。

スマートフォンはいずれx86 PCを埋葬するだろうとnVidia CEOは語る

ARMが最も重要なCPUアーキテクチャとなるだろう – Jen-Hsun Huang
Anton Shilov
2010年9月27日

パーソナルコンピュータ市場は未来には根本的な変化に直面するだろう – nVidia CEOであるJen-Hsun Huangは語った。ARMが未来の最も重要なマイクロプロセッサとなり、x86ベースシステムを葬るだろう。

「未来のPCは新しいOEM企業によって製造され、新しいディストリビュータにより販売され、そして新しいインストラクションセットのアーキテクチャが使われるだろう。ARMは未来の最も重要なCPUアーキテクチャであり、既に最も成長著しいプロセッサアーキテクチャである」とHuang氏はEETimesウェブサイトのインタビューに答えた

nVidia自身はTegraと呼ばれるARMコアと自社グラフィクスコントローラを統合したSoC製品を販売している。だがnVidia Tegraは多めに見ても成功したとはいえず、そのビジネスは成長しパワフルなスマートフォンで重要な市場で成長するだろうと見られている。だけれども、ARMは恐らくx86の非常に薄い部分しか獲得できるチャンスはないだろう。ARMは性能、特にサーバ分野においてx86に対し競争することが出来ない。それに加えx86チップは3社によって製造され、様々なPC市場やソフトウエア開発者により力強く支持されている。

nVidiaのコアビジネスはx86CPUをベースとしたPC向けグラフィクスカードある。その結果nVidiaの興味はx86マイクロプロセッサの成長を行儀よく見守ることでありGPU需要を換気させることである。

—-

現実見えてないよーw
xbitlabs.comのコメント欄でワロタ。

うわさ nVidiaがGlobal FoundriesにTegraの生産を委託する? – TSMCからの報復はあるのか By SemiAccurate Charlie Demerjian氏記事

Nvidia signs up with Global Foundries TSMC not the only one anymore by Charlie Demerjian September 21, 2010 より。

nVidiaはGlobal Foudriesと契約した

TSMCはもはやたった一つのパートナーではない。
by Charlie Demerjian
2010年9月21日

nVidiaがTSMCを唯一のファウンドリパートナーとして癒着してきたが綺麗に剥がれた。nVidiaのCEOであるJen-HsunがIntel互換のx86チップを製造しないと頑なに主張していた。不幸にも、この文章は彼が2009年にFermiのモックアップを本物として掲げていたことと同じことが起きた。nVidiaのCEOはTSMCについて「最も友好的な国家」のようだと自慢するのが好きで、ファウンドリのロイヤリティが理由である。その利益はより大きな恩恵を与えていたが、誠実という言葉はnVidiaのメッセージからは読み取れない。SemiAccurateはTSMCから永続的なロイヤリティを宣誓していた時でさえnVidiaはGlobal Foudriesと交渉を行っていた証拠を見てきた。

交渉から1年も立たないうちに、nVidiaはGlobal Foudriesと最終的に契約したように見える。その理由は謎としてまだ多少隠されているが、それはGPUの為ではなく、ニュースソースはほぼ確実にTegraとARMベースチップのためであると語っている。

Global FoundriesはARMと非常に密に連携しており、SOI製造能力を持ち、次世代及び次次世代プロセッサについて競合他社から一つ抜きん出ているように見える。Global Foundriesは多分28nmプロセスの生産能力の余剰が殆ど無く、様々なボリュームの製品出荷のために低い生産量で長い時間生産されるだろうTegraはその余剰に完全にフィットする。

もしこのニュースが忠誠心のない輩からのリークならば、緑色のボーイたちはいくつか整合の取れない疑問を受けることを意味する。自身のファウンドリパートナーを騙すことを軽く見ていないだろうが、私はまだ罵声の嵐いっぱいの岩塩が充満したショットガンで暴言を撃ちまくるMorris Chang(TSMC元会長・台湾半導体業界の最重鎮)を見ていない。私はどんなことがあろうとnVidiaがファウンドリからの数多くのサービスを失うのを見るだろう。それは恐らく昨年まで彼らについて誠実だった会社が受けるより良い仕打ちであるが、なぜ会社の長期間のトレンドを破壊するのだろうか?

—-
ありゃー、またnVidiaやっちゃったよ。2009年のモック以降まただよ。こんな簡単に関係を崩してもいいのかな?

Intelは開発中のLarrabeeをGPUとしてリリースすることを諦める – IDFでIntel GPU開発ディレクターが語る

xbitlabs.com Intel Unlikely to Release Larrabee As Discrete Graphics Processor – Company. Intel Admits Lack of Practicability with Larrabee Graphics Chip [09/16/2010 10:05 PM] by Anton Shilov より。

Intelは開発中のLarrabeeをディスクリートGPUとしてはリリースすることは疑わしい。

IntelはLarrabeeのグラフィックスチップとしての実現可能性を欠いていると認める。

By Anton Shilov
2010年9月16日

Intelは、Larrabeeアーキテクチャベースのディスクリートグラフィックスプロセッサとしてリリースする可能性はないだろうと、Intelアーキテクチャグループのグラフィクスアーキテクチャ部門のディレクターは語った。それに加え役員は、Larrabeeは最終的には性能と消費電力において能力不足という設計上の問題を抱えていると認めた。

「私は単に全てのソフトウエアの複雑性を眺めて全ての機能をソフトウエアで実行することを試行することは実用的ではないと思うだけだ。そして我々はこれらのことを行うためにワットあたりの性能問題にあたってしまった。」とIntelアーキテクチャ部門のグラフィックスアーキテクチャ開発ディレクターのThomas PiazzaはIntel Developer Forum(IDF)の期間中に語ったとTechradarウェブサイトは報告している。

Larrabeeグラフィックスプロセッサは現在のAMDやnVidiaグラフィクスチップに比べてより柔軟にプログラム可能な機能を備えた特徴のグラフィックスハードウエアであった。どうやらIntelはグラフィクスプロセッシングユニット(GPU)内に固定機能のブロックとプログラム可能なブロックとの間に最適なバランスを取ることに失敗した。例として、Intelはプログラマブルラスタライザ(様々なグラフィックスを表示するために様々なアプローチを提供することが可能)を内蔵しようと試行したが、結局大変な役立たずになってしまうという結果に終わった。

「私たちはプログラム可能な機能の適切なレベルと固定機能の適切なレベルを見つけ出そうと努力した。…当然の結果としてラスタライザは固定機能として必要であった。それがプログラム可能であるという必要性は何もない。プログラムコードの関連性を試したことでそのようなプログラム可能な機能の範囲は非常に小さかった」とPiazza氏は付け加えた。

2009年にIntelは,恐らく最初のLarrabee GPUとしてリリースされると思われる特徴のチップを載せたKnight Ferry development boardをリリースした。そのボードはハイパフォーマンスコンピューティング(HPC)や関連するアプリケーション向けに設計されたmany Intel cores(MIC)能力を確かめるソフトウエアディベロッパ向けであった。Knights Ferryは32個のx86アーキテクチャと1.2GHzクロックと4つのHyperThreadingを特徴としていた。そのユニットはPCI Express 2.0に差し込み、2GBのGDDR5メモリを搭載している。そのチップ自身は8MBの共有L2キャッシュを搭載し高並列アプリケーション向けには非常に興味をそそられるものであったがグラフィックスアプリケーションを実行するにはそのような大きなキャッシュメモリは必要無い。

もしIntelがLarrabeeベースのディスクリートGPU製品を将来出すと予想するかと尋ねられたとき、Piazzaは報道によると一言、「私はそうは思わない」と語ったという。

—-

ま、これまでのIntelのGPU関連の実績したら言わずもがなという感想のみ。だけどGPU全体の市場では過半数を占めるという普及率はすごい。

AMDのモバイル向け「Bobcat」アーキテクチャ仕様のGPU統合型CPU「Zacate」の動作写真 by SemiAccurate Chalie Demerjian氏記事

AMD Shows off Bobcat systems Not quite IDF 2010: Shiny shiny things by Charlie Demerjian September 13, 2010 より。

AMDは「Bobcat」システムを公開した。

IDF 2010まで待てない : 非常に輝かしい偉業
By Charlie Demerjian

2010年9月13日

ここにいくつかのAMD「Bobcat」プラットフォームの動作写真があり、特に「Zacate」CPUがゲーム「City of Heroes: Going Rogue」が動作している画像がある。またCPUそのもののいくつかのチーズケーキショット画像がある。楽しんでくれ。

「Zacate」プラットフォーム

「Zacate」CPU写真

「City of Heroes」は滑らかに動作し、また我々が見たデモは何の描画引っ掛かりも不具合もなかった。これは統合型GPUが思われているより大きく変化しているとみるべきである。

AMDとIntelのGPU統合型CPUのプレゼンバトルが来週行われる

All of AMD  AMD to Demonstrate Next Generation PC Experience Powered by AMD Fusion APU Codenamed “Zacate” September 10, 2010 by Steve Howard

semiaccurate.com Sandy Bridge for sale in early 2011 IDF 2011: Less than two weeks in by Charlie Demerjian September 12, 2010

xbitlabs.com AMD to Demonstrate CPU-GPU Chip Live Next Week. AMD to Spoil IDF with Zacate [09/10/2010 03:29 PM] by Anton Shilov より。

概要として、

  • IntelのIntel Developer Forum(以下IDF)が来週行われる。
  • そこで、IntelのGPU統合型CPU「Sandy Bridge」の技術解説が行われる予定。
  • さらにIntelの次世代チップセットはUSB3.0及びSATA 6Gbpsをサポートするとの噂。
  • それに対しAMDは「Bobcat」アーキテクチャベースのGPU統合型CPU「Zacate」の発表をIntelのIDF開催中にぶつける
  • AMDの「Zacate」はFusion APUのデュアルCPUで、18Wの低消費電力で動作する。
  • 「Zacate」のGPU部は、DirectX11にフル対応し、1080pを含むハードウエア動画再生機能UVD3、OpenCL、DirectComputeに対応。
  • 「Zacate」のダイサイズは100mm^2以下との噂がある。

両者の技術発表が楽しみ。IntelのGPUは何時まで経ってもDirectX11に対応できない分AMDに多少有利。まあIntelは多少なんぞ物ともせずにAMD含めて競合他社すべてに対し絶対的優位に立っているが。

AMDの公式ブログで「Bulldozer」の20の質問パート2 バカ訳すみません

AMDの公式ブログで「Bulldozer」の20の質問パート2

  • 同じモジュール内でコア同士の「プログラム可能な」同期機能はある?またもし自分のマルチスレッドアルゴリズムを互いのスレッドに近いペアを組むことで性能を上げることはできるの?
    – Edward Yang

    • うん、良い質問だ。
    • 基本的にはOSがスレッドのスケジュールを管理する。WindowsやLinuxなら効果的にBulldozerのコア間のスケジュールをこなすよ。
    • OSは最高性能か最高ワットパフォーマンスのどちらを優先させるかでコア性能をブースとさせるよ。
    • だけど違うモジュールで最高性能をだすために自分でスケジューリングできるよ。
    • 二つの整数演算コアは完全に別れており、実行パイプラインはL1キャッシュではデータ共有されない。これはソフト側で最適化する必要はないから。
    • L2キャッシュは二つの整数演算コアで共有されており、同時に実行パイプラインから読むことができるが書込はどちらか一つのみなんで注意ね。
    • ということは、二つのスレッドが共有するL2キャッシュにフィットするようなデータを自分でセットすることが可能。これで性能がより向上するだろう。
    • 忘れないでほしいのは他のコアのこと。データ共有のメリットと次の実行可能なコアにデータを送るためのメリットを天秤にかける必要があるよ。
    • 通常すぐに実行可能なスレッドの側に次のスレッドを準備しておくことが良い。
    • もしマルチスレッドアプリケーションがL2キャッシュ向けに最適化していないかL3キャッシュ向けに最適化している場合、はっきりとスレッドを分けたほうが良い。努力しない方がいいよ。そうしなくてもスケジューラが最適に実行するから。
  • Bulldozerで違うモジュールの二つのコアで実行する場合と同じモジュールで二つのスレッドを実行する場合どのくらい性能がアップするの?
    – Simon

    • Hot Chip22でプレゼンした資料を見て。CMP(Chip MultiProsessing 複数のコアチップを一つのコアに納めた単純な方法)と比較して、二つの整数演算コアでの性能は大体80%向上する。
    • けどこれはリソースを共有しているから出せる性能。
    • CMPはいくつか欠点があり、それは熱とダイサイズが大きくなること。そのため性能が消費電力により制限されてしまう。
    • 簡単に考えて、4シリンダの300馬力と6シリンダーの360馬力のエンジンではどちらが排気ガスが少ない?
    • シリンダーあたりの馬力比は、75馬力/4シリンダーと60馬力/6シリンダーとなり、4シリンダーの方がシリンダーあたりの性能が高い。
    • けどエンジン全体で見ると、4シリンダのエンジンは低い性能で高いコストになり、より排気ガスが多くなるよ。
  • 現在IntelのNehalem EXベースの8ソケット64コアサーバをIBMとHPが出しているよね。Bulldozerベースのサーバではスケーラビリティをどのように出すことができるの?
    – David Roff

    • Bulldozerは現在の「Maranello」「San Marino/Adelaide」プラットフォームに適しているね。
    • 「Maranello」は4CPUをサポートしている高性能プラットフォーム。
    • 「Maranello」プラットフォームと16コア「Interlagos」プロセッサを組み合わせると4ソケット×16コア=64コアになるよ。
    • IDCによると、8ソケットのx86プラットフォーム市場は26%落ち込んでいる。
    • 2009年が不況だからだというなら、2007年や2008年の8ソケットx86プラットフォーム市場と比べると横ばい。
    • すなわち市場は成長していないんだよ。この事は結構市場にインパクトを与えられるんだよ。
    • 8ソケット64コアではメモリ搭載に必要な面積が大きくなるが、4ソケットだと低価格で小さいサイズ、低消費電力になる。
    • Bulldozerは2011年にこれを実現するからよろしくー。
  • 性能を見る限りだと、Bulldozerは一般・ビジネス向けCPUに求められる消費電力制御を持っていない様に見えるよ。現在のマルチコアユーザが乗り換える意味のある新しい特徴はないの?Bulldozerが現在ビジネスに求められている新しい消費電力削減機能を細かく説明できる?
    – Jeremy Stewart

    • 「Maranello」プラットフォーム向けの現在出荷中のOpteron 6100シリーズにBulldozerが備えている電力削減機能は既に組み込み済み。
    • 既に公式ブログには書いたけど、現在のマルチコアプロセッサの水準を上げる性能を提供するよ。
    • 私たちは動的共有及び動的リソース配分を備えた消費電力に効果的なマイクロアーキテクチャを実装しているよ。高速なクロックとパワーゲーティングを活用してね。
    • プロセッサのチップレベルのコアパワーゲーティングをサポートしているよ。
    • そのOpteron6100の新しい技術はPowerNow!やCoolCore、低電圧DDR3メモリサポートで非常に良い感じ。
    • 33%のコア数増加とより大きなキャッシュで、現在の我々の12コアプロセッサと同じ消費電力なんだよ。

—-

Nehalem EXの言い訳は苦しいな、AMDw。あとJeremy偉そうだぞ。謙虚に質問しろよ。