次世代GPUアーキテクチャ「Fermi」の内部構造に迫る:NVIDIA GPU Technology Conference(2/2 ページ) 512個のCUDAコアで爆速演算が可能になっているFermi NVIDIAが公開したFermiの内部構造によると、Fermiには「CUDAコア」と呼ばれるプロセッサコアが512個も内蔵されており、この膨大な数のCUDAコアを利用してベクトル演算などで多用される並列演算をこなしていく。Fermiでは、32個のCUDAコアを1つの単位として、SM(Streaming Multiprocessor)と呼ばれる演算ユニットを構成する。FermiではSMが16個用意されることになる。 プログラムから送られてきた演算命令は、「GigaThread」と呼ばれるスケジューラを利用して、スケジューリングされて各SMに送られる。各SMでは、GT200の1つから2つと倍に