いつの間にか Ubuntuを12.04 と CUDA 4.2 が正式リリースされていたので、インストールしました。 インストールは以下の順序で行います。 Ubuntu 12.04 NVIDIA製ディスプレイドライバ CUDA Toolkit 4.2 GPU Computing SDK 4.2 サンプルプログラムのコンパイルに必要なライブラリ等 GPU Computing SDK はインストール後に修正する必要があります。CUDA Toolkit も 4.1 では修正が必要でした(Ubuntu 12.04にCUDA 4.1をインストールした時のメモ - irieめも)が、4.2 ではそのままでOKです。 Ubuntu 12.04 インストール方法はいろいろなところに書かれているので、ここでは省略します。使用するPCが Core i7 CPU + メインメモリー 16GiB ということで、64
【連載移籍のお知らせ】 DOS/V POWER REPORTは2024年冬号をもって休刊しました。以下の連載は掲載の場をAKIBA PC Hotline!(https://akiba-pc.watch.impress.co.jp/)に移して継続中です。よりいっそうパワーアップした内容にもご期待ください。 <新装連載中!(2024年7月現在)> GPU Round-Robin Benchmark https://akiba-pc.watch.impress.co.jp/backno/special/gpu_benchmark/ VIDEO CARD LABORATORY https://akiba-pc.watch.impress.co.jp/backno/special/videocard_lab/ 最新自作計画(※竹内亮介のオレにPCケースを使わせろ!と合併) https://akiba
PSVitaのメモリーカードをヨドバシカメラ.comで買った被害者を探してみた。 (風の吹くまま 気の向くままに ~ blow with the wind ~) PS Vitaの発売日ですごいことに! (燃え萌えアニメブログ) IMAXデジタルシアターとは何だったのか?ユナイテッド・シネマ豊洲に日本最大級3Dスクリーン「オーシャンスクリーン」が誕生! (N氏の映画館:不定期日記) ブロガー執筆書籍紹介 3D世界規格を作れ! (事務局だより) 【経済産業】 『3D世界規格を作れ!』 (神様はその辺をウロウロしていません) 写真点描・札幌花物語 8 (つき指の読書日記by大月清司) PSP go の最新情報について (新型PSP★購入ガイド 色 PSP-3000 ワンセグ TV出力 薄い 薄型) Apple iPod touch 第3世代 32GB MC008J/A 最新モデル | (アマゾン
次世代GPUアーキテクチャ「Fermi」の内部構造に迫る:NVIDIA GPU Technology Conference(2/2 ページ) 512個のCUDAコアで爆速演算が可能になっているFermi NVIDIAが公開したFermiの内部構造によると、Fermiには「CUDAコア」と呼ばれるプロセッサコアが512個も内蔵されており、この膨大な数のCUDAコアを利用してベクトル演算などで多用される並列演算をこなしていく。Fermiでは、32個のCUDAコアを1つの単位として、SM(Streaming Multiprocessor)と呼ばれる演算ユニットを構成する。FermiではSMが16個用意されることになる。 プログラムから送られてきた演算命令は、「GigaThread」と呼ばれるスケジューラを利用して、スケジューリングされて各SMに送られる。各SMでは、GT200の1つから2つと倍に
GeForce GT 640 (1024MB GDDR5) NE5T6400HD06-2081F [PCIExp 1GB] 価格比較 ホーム > パソコン > グラフィックボード・ビデオカード > Palit Microsystems(パリット マイクロシステム) > GeForce GT 640 (1024MB GDDR5) NE5T6400HD06-2081F [PCIExp 1GB] Palit Microsystems 2013年 6月 5日 登録 GeForce GT 640 (1024MB GDDR5) NE5T6400HD06-2081F [PCIExp 1GB] お気に入り登録 10 最安お知らせメールが受け取れます 価格.com プロダクトアワード2024 ユーザーの支持が高かった16部門の大賞が決定!今年の受賞製品は? 価格情報の登録がありません 価格推移グラフ お気に
といってもGeForce GTX TITANでもGTX 780でもなく、もちろんバカ高いTesla K20でもない。 GeForce GT 640である。 GTX 690やGTX 770さえ対応していないCC3.5になぜかGT 640が対応してるのである。 ただしGT 640なら全部対応してるわけではない。 新コア搭載品だけである。 何も考えずに買ったらCC3.5非対応のものを掴む可能性が高い。 今回は買ったのはPalitのNE5T6400HD06-2081F。 ドスパラで7,950円だった。 基板のサイズ自体はロープロ対応だけど、ロープロブラケットが付属してないので注意。 一般的なコネクタ配置なので他のグラボのロープロブラケットが流用できるかも。 今回はWinFast GT520 1024MBのロープロブラケットを流用した。 上はWinFast GT520 1024MB。 カード長は同じ
NVIDIA CUDA 5を発表、世界で最も普及している並列コンピューティング・プラットフォームにおけるプログラミングがさらに容易になる 無償ダウンロード可能な最新バージョンには、 開発生産性を高める新しいツールやライブラリー、機能満載 2012年10月15日 - カリフォルニア州サンタクララ - NVIDIA(本社:米国カリフォルニア州サンタクララ、社長兼CEO: ジェンスン・フアン(Jen-Hsun Huang)、Nasdaq:NVDA)は本日、NVIDIA® CUDA® 5のプロダクション・リリースを発表しました。GPUを活用して科学アプリケーションや工学アプリケーションを高速化する並列コンピューティングのプラットフォームおよびプログラミングモデルとして、世界で最も普及しているCUDAのパワフルな最新バージョンでが、NVIDIA Developer Zoneウェブサイトから無償ダウン
CUDA C++ Programming Guide The programming guide to the CUDA model and interface. Changes from Version 12.5 Added sections Atomic accesses & synchronization primitives and Memcpy()/Memset() Behavior With Unified Memory. Added section Encoding a Tensor Map on Device. 1. Introduction 1.1. The Benefits of Using GPUs The Graphics Processing Unit (GPU)1 provides much higher instruction throughput and
Developing a Linux Kernel Module using GPUDirect RDMA The API reference guide for enabling GPUDirect RDMA connections to NVIDIA GPUs. 1. Overview GPUDirect RDMA is a technology introduced in Kepler-class GPUs and CUDA 5.0 that enables a direct path for data exchange between the GPU and a third-party peer device using standard features of PCI Express. Examples of third-party devices are: network i
概要 近年、GPUの性能は飛躍的に向上しており、グラフィック専用の処理装置としてではなく、数値計算等の汎用向けの処理に利用する、GPGPUに関する研究が盛んに行われている。GPUは内部に多くのコアを備えており、NVIDIA社のGeForce GTX 580では、512個ものコアを保持している。これらのコアすべてを効率よく利用することで、GPUの持っている高いパフォーマンスを引き出すことが出来るが、GPUの高い並列性を利用するためにはGPU特有の処理を実装する必要があり、GPUプログラミングになじみの無い利用者にとっては処理の記述が困難である。 そこで、GPUを大量のコアを持ったプロセッサだと考え、これらに対してMapReduceを適用することを検討する。親しみやすいMapReduceインターフェースにあてはめて処理を記述するだけで、GPUの高い並列性を生かしたプログラムが実装可能となる。加
今回は、サンプルソースを 64bit 版のWin32 コンソールアプリケーションとしてビルドしてみる。 参考にしたドキュメントは、”ATI Stream SDK OpenCL™ Programming Guide (v1.0) [PDF 900 KB]” このファイルには、以下の手順で たどりつける。 「スタート」メニューから「すべてのプログラム」-「ATI Stream SDK v2」-「ATI Stream SDK Documentation」を選択すると、ブラウザで、「ATI Stream SDK v2.01 Documentation」のページが開く。開いたページのリスト中に上記ファイルがある。 Visual C++ 2008 Express Edition を起動する。 「ファイル」メニューから「新規作成」-「プロジェクト」を選択。 「プロジェクトの種類」から「Win32」を選択
先日ビデオカードを買いました。GPUにAMD Radeon HD5670を積んだマルチディスプレイ対応で、マニュアル開いたままコードが書けて重宝しています。僕は3Dバキバキのゲームやらないし、グラフィクスには疎く絵心皆無なのでグラフィクスを多用したアプリケーションも書きません(DirectXなんか面白そうなんですけどね)。なので普段はせっかくのGPUがアクビしてます。HD5670にはプログラマブルシェーダー、ようは小さなCPUが400基も詰め込まれているらしいのですが、なんともMOTTAINAI。 ヒマを持て余しているようすのGPUに仕事をさせようと、OpenCLで遊んでみました。本稿ではOpenCL C++ Bindingによるマンデルブロ集合の計算を試みます。 OpenCL GPUの計算性能は当然のことながらグラフィクス計算(そのほとんどがベクトルと行列演算)に使われているのですが、こ
Ck:要素数kの頻出アイテム集合の候補の集合 Lk:要素数kの頻出アイテム集合の集合 minsupは最小サポートを満たすために必要なトランザクション数 - 最小サポートにトランザクションの総数|D|を乗じた値。 トランザクション、候補アイテム集合、頻出アイテム集合中のアイテムは、 すべてある決まった順序にソートされている。 C1からL1を生成 アイテム集合C1 D → スキャン アイテム集合L1カウント 候補 → 生成 {A}{A}2 {B}{B}3 {C}{C}3 {D}{E}3 {E} C2からL2を生成 アイテム集合C2 D → スキャン アイテム集合L2カウント 候補 → 生成 {A,B}{A,C}2 {A,C}{B,C}2 {A,E}{B,E}3 {B,C}{C,E}2 {B,E} {C,E} C3からL3を生成 アイテム集合C3 D → スキャン アイテム集合L3カウント
アソシエーション分析(associations analysis)は、百貨店や店舗などで集めている表1のようなトランザクションデータを活用するために、バスケットの中の商品間の関連性について分析を行う方法である。アソシエーション分析は、表1に示すような、トランザクションデータから、頻出するアイテムの組み合わせの規則を漏れなく抽出し、その中から興味深い結果を探し出すことを主な目的とする。 アソシエーション分析は、1990年代初めに英国の有力百貨店マークス&スペンサーの店舗で集めているデータの活用に関して相談を受けたことをきっかけとして、IBM研究所が研究を始め、Apriori(アプリオリ)というアルゴリズムを開発したと言われている。Aprioriアルゴリズムは、巨大なデータベースからアソシエーションルール(associations rules)を抽出することを実現し、データマインニングの実用
追記: 以下の内容は既に古い。 OpenCLのサポート状況は当時よりだいぶ向上してきたと言える。 http://wiki.monaos.org/index.php?.mjt/mosh/OpenCL OpenCL実装は1.0実装と1.1実装が混在しているのが現状と言える。今のところ、OpenCLは完全なクロスプラットフォームを実現できる状況ではなく、(現状のOpenGLのように)パフォーマンスを追求するならベンダ固有のコードをいくつか追加する必要があるだろう。 試すなら MacOS XならAppleの実装一択。(Mac版CUDA toolkitはOpenCLを持っていない) nVidiaのCUDA対応GPUを持っているならCUDA toolkit。名前はCUDA toolkitだがOpenCLもサポートしている。機能豊富。CUDA toolkitはGPU上でしか実行できないので、必要に応じて
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く