プロジェクト

全般

プロフィール

グラフィックスカード

OpenGLカードとDirectXカードとの違い

NVIDIA製品では、OpenGLカードとされるQuadro製品系列とDirectXカードとされるGeForce製品系列があります。
この違いについて、ネット等をあさって断片情報を集めてみました。

  • 一般的には
    • GeForceがDirectX系処理向きで演算処理は精度より速さ重視
    • QuadroがOpenGL系処理向きで演算処理は速さより精度重視
      • Quadroは倍精度で演算
    • よって、アプリケーションによってはQuadroでは正常動作するがGeForceではダメなものがある。
      • 例)一部テクスチャが落ちる、辺を共有する面の共有辺のあいだに隙間がある、辺を共有する面が共有辺において交差している、辺を共有する面と直線が完全には重ならない
      • GeForceでAutodesk実行時、パンやズームを行ったとき一瞬描画が飛ぶ
    • GeForce系列もOpenGL ICDを含むのでOpenGLアプリケーションが動くが、Quadro系列はドライバの動作検証が追加されている。
      業務用途のQuadroでは描画が正しく意図通りになっているかを検証しているし、OpenGLアプリケーションのベンダー各社が自社アプリケーションの動作検証を実施したドライババージョンを公開している。
    • GeForce系列では、バージョンによって出力画像に微妙な違いがあることが多い
  • QuadroでOpenGLが速い理由
    • 解釈として業務用途OpenGLアプリケーションは表示品質を確保するため、QuadroではOpenGLを呼ぶがGeForceではソフトウェアエミュレーションしているため、一部のアプリケーションでQuadroが速い結果となる。
  • 菱洋エレクトロの解説
    • プロフェッショナル用途にはQuadro。
      • 長時間のCADでの設計業務、CAEでの解析業務、CG作成でのレンダリングなど、高い安定性、信頼性が求められる用途。
      • フリーズが許され難い使用環境。
    • QuadroはNVIDIA社自身が設計、製造、検査している。長期間(18~24ヶ月)の製品提供と3年間の保証、企業向けサポート体制
    • 大手ソフトウェア・パートナー各社と協力しアプリケーションの最適なパフォーマンス、安定性を確保する体制、ISV各社がテスト実施と認証を行う
    • 10/12ビットグレースケール出力、30ビットカラー出力

GPGPU観点の情報整理

NVIDIA Keplerアーキテクチャ

GPC(Graphics Processing Cluster)

  • SMX×2基
  • ROPパーティション、L2キャッシュ、メモリインタフェースとクロスバー接続

SMX(Streaming Multiprocessor eXtreme)ユニット

  • 単精度CUDAコア×192個を持ちます。
  • ワープスケジューラ×4個
    32本の並列スレッドをグループ化した「ワープ」単位にスケジューリングされます。
  • 命令ディスパッチユニット×8個(ワープスケジューラにつき2個)
    1ワープにつき1サイクルに独立した命令を2つ発行できます。
  • 1スレッドからアクセス可能なレジスタ数が最大255個
  • L1キャッシュ

単精度CUDAコア

  • 浮動小数点演算ユニット
  • 整数演算ユニット

ドライバーソフトウェア

NVIDIA

参考情報

  • NVIDIA グラフィックス ドライバーの入れ直し - Display Driver Uninstaller(DDU)の使い方
    NVIDIAドライバーをきれいに再インストールする2つの方法を紹介しているブログです。1つ目はNVIDIAドライバーのインストール時に「カスタム(詳細)」を選び、次の画面で「クリーンインストールの実行」にチェックを付け、インストール対象要素は最低限「PhsyXシステム」を選ぶ。もうひとつはDisplay Driver Uninstallerを使う方法。

製品情報

NVIDIA Quadroシリーズ

型式 CUDA メモリ 消費電力 出力 CINEBENCH R15 備考
K600 Kepler 192 DDR3 1GB 128bit 41W DVI-I×1, DP×1 28.0 ロープロファイル
K620 Maxwell 384 DDR3 2GB 128bit 45W DVI-I×1, DP×1 77.42 ロープロファイル
K1200 Maxwell 512 GDDR5 4GB 128bit 46W MiniDP×4 ロープロファイル、実売5万円
K2000 Kepler 384 GDDR5 2GB 128bit 51W DVI-I×1, DP×2 73.54
K2200 Maxwell 640 GDDR5 4GB 128bit 68W 121.53
K4000 Kepler 768 GDDR5 3GB 192bit 80W DVI-I×1, DP×2
K4200 Maxwell 1344 GDDR5 4GB 256bit 108W 147.59
K5000 Kepler 1536 GDDR5 4GB 256bit 122W DVI-I×1, DVI-D×1, DP×2 144.55
K5200 Maxwell 2304 GDDR5 8GB 256bit 150W 148.8
K6000 Keper 2880 GDDR5 12GB 384bit 225W DVI-I×1, DVI-D×1, DP×2 190.31
  • Intel HD Graphics 4000のCINEBENCH R15は、9.0

クリップボードから画像を追加 (サイズの上限: 1 GB)