AMD 인스팅트

AMD 인스팅트(AMD Instinct, 구 명칭: 라데온 인스팅트, Radeon Instinct)는 AMD의 딥 러닝 지향 GPU 브랜드이다.^[1]^[2] 2016년 AMD의 파이어프로 S 브랜드를 대체하였다. 라데온 브랜드의 주류 소비자/게이머 제품에 비해 AMD 인스팅트 브랜드의 제품들은 딥 러닝, 인공신경망, 슈퍼컴퓨터/GPGPU 응용을 가속화하기 위해 고안되어 있다.

AMD 인스팅트 제품 계열의 경쟁 제품은 엔비디아의 테슬라 계열의 딥 러닝 및 GPGPU 카드이다.

제품

초기 3개의 AMD 인스팅트 제품이 2016년 12월에 발표되었으며, 각각 각기 다른 아키텍처에 기반을 둔다.

MI6

MI6은 패시브 쿨링 방식의 16 GB의 GDDR5 메모리 및 150 W 미만의 TDP를 갖춘 폴라리스 10 기반 카드이다.^[1]^[2]MI6은 358 GFLOPS의 최고 배정밀(FP64) 연산 성능을 보여준다.^[3]

MI8

MI8은 피지(Fiji) 기반의 카드로서, R9 나노와 닮아있으며, TDP는 175W 미만인 것으로 짐작된다.^[1] MI8은 4 GB의 고대역 메모리를 갖추고 있다. MI8은 512 GFLOPS의 최고 배정밀(FP64) 연산 성능을 보여준다.^[4]

MI25

MI25는 HBM2 메모리를 활용하는 베가 기반의 카드이다. MI25의 성능은 FP32 수를 사용, 12.3 TFLOPS로 예측된다. MI6, MI8과 달리, MI25는 더 낮은 정밀도의 수를 사용할 때 성능이 향상될 수 있으므로 FP16 수를 사용 시 24.6 TFLOPS에 도달할 것으로 예측된다. MI25는 패시브 쿨링과 함께 할 경우 300W 미만의 TDP로 측정된다. MI25는 또한 16분의 1의 레이트에서 768 GFLOPS 최고 배정밀(FP64)의 속도를 제공한다.^[5]

소프트웨어

MxGPU

MI6, MI8, MI25 제품들 모두 AMD의 MxGPU 가상화 기술을 지원하며, GPU 자원을 여러 사용자들과 함께 공유할 수 있게 한다.^[1]^[6]

MIOpen

MIOpen은 딥 러닝의 GPU 가속화를 지원하는 AMD의 딥 러닝 라이브러리이다.^[1] 대체적으로 GPUOpen의 볼츠먼 이니셔티브 소프트웨어를 확장한다.^[6] 엔비디아의 CUDA 라이브러리의 딥 러닝 부분과 경쟁하기 위해 고안되었다. 다음의 딥 러닝 프레임워크를 지원한다: Theano, Caffe, 텐서플로, MXNet, The Microsoft Cognitive Toolkit, Torch, Chainer. 프로그래밍은 OpenCL과 파이썬을 지원하며, 이 외에 Portability and Heterogeneous Compute Compiler를 위해 AMD의 다기종 연산 인터페이스를 통한 CUDA의 컴파일을 지원한다.

칩셋 표

모델	런칭일	코드명	아키텍처	팹 (nm)	트랜지스터	다이 크기 (mm²)	버스 인터페이스	클럭 속도			코어 구성^[a]	필레이트		메모리				처리 능력 (GFLOPS)			TDP (W)	API 지원 (버전)
모델	런칭일	코드명	아키텍처	팹 (nm)	트랜지스터	다이 크기 (mm²)	버스 인터페이스	코어 (MHz)	부스트 (MHz)	메모리 (MT/s)	코어 구성^[a]	픽셀 (GP/s) (부스트)^[b]	텍스처 (GT/s) (부스트)^[c]	크기 (GiB)	버스 너비 (비트)	버스 유형	대역 (GB/s)	단정밀도 (부스트)^[d]	배정밀도	반정도 (부스트)	TDP (W)	OpenCL
Radeon Instinct MI6^[1]^[2]^[6]^[7]	TBA	Polaris 10	GCN 4^th gen	14	5.7	232	PCIe 3.0 x16	발표 예정	발표 예정	발표 예정	2304:144:?:36	발표 예정	발표 예정	16	256	GDDR5	224	5800	358	5800	150	발표 예정
Radeon Instinct MI8^[1]^[2]^[6]^[8]		Fiji XT	GCN 3^rd gen	28	8.9	596		발표 예정	발표 예정	발표 예정	4096:256:?:64	발표 예정	발표 예정	4	4096	HBM	512	8200	512	8200	175	발표 예정
Radeon Instinct MI25^[1]^[2]^[6]^[9]^[10]		베가 10	GCN 5^th gen	14	12.5	486		발표 예정	발표 예정	발표 예정	4096:256:?:64	발표 예정	발표 예정	16	2048	HBM2	484	12300	768	24600	300	발표 예정

↑ Single-precision shader processors : Texture Mapping Units : Render Output Units (Compute Units)
↑ Pixel fillrate is calculated as the number of ROPs multiplied by the base (or boost) core clock speed.
↑ Texture fillrate is calculated as the number of TMUs multiplied by the base (or boost) core clock speed.
↑ Single precision performance is calculated from the base (or boost) core clock speed based on a FMA operation.

같이 보기

각주

↑ ^가 ^나 ^다 ^라 ^마 ^바 ^사 ^아 Smith, Ryan (2016년 12월 12일). “AMD Announces Radeon Instinct: GPU Accelerators for Deep Learning, Coming in 2017”. Anandtech. 2016년 12월 12일에 확인함.
↑ ^가 ^나 ^다 ^라 ^마 Shrout, Ryan (2016년 12월 12일). “Radeon Instinct Machine Learning GPUs include Vega, Preview Performance”. PC Per. 2016년 12월 12일에 확인함.
↑ “Radeon Instinct MI6”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}
↑ “Radeon Instinct MI8”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}
↑ “Radeon Instinct MI25”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}
↑ ^가 ^나 ^다 ^라 ^마 Kampman, Jeff (2016년 12월 12일). “AMD opens up machine learning with Radeon Instinct”. TechReport. 2017년 8월 9일에 원본 문서에서 보존된 문서. 2016년 12월 12일에 확인함.
↑ “Radeon Instinct MI6”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}
↑ “Radeon Instinct MI8”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}
↑ Smith, Ryan (2017년 1월 5일). “The AMD Vega Architecture Teaser: Higher IPC, Tiling, & More, coming in H1'2017”. Anandtech.com. 2017년 1월 10일에 확인함.
↑ “Radeon Instinct MI25”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}

[a-7] Single-precision shader processors : Texture Mapping Units : Render Output Units (Compute Units)

[pixel_fillrate-8] Pixel fillrate is calculated as the number of ROPs multiplied by the base (or boost) core clock speed.

[texture_fill-9] Texture fillrate is calculated as the number of TMUs multiplied by the base (or boost) core clock speed.

[single_FLOPS-10] Single precision performance is calculated from the base (or boost) core clock speed based on a FMA operation.

[anand-1] 가 ^나 ^다 ^라 ^마 ^바 ^사 ^아 Smith, Ryan (2016년 12월 12일). “AMD Announces Radeon Instinct: GPU Accelerators for Deep Learning, Coming in 2017”. Anandtech. 2016년 12월 12일에 확인함.

[pcper-2] 가 ^나 ^다 ^라 ^마 Shrout, Ryan (2016년 12월 12일). “Radeon Instinct Machine Learning GPUs include Vega, Preview Performance”. PC Per. 2016년 12월 12일에 확인함.

[3] “Radeon Instinct MI6”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}

[4] “Radeon Instinct MI8”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}

[5] “Radeon Instinct MI25”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}

[TR-6] 가 ^나 ^다 ^라 ^마 Kampman, Jeff (2016년 12월 12일). “AMD opens up machine learning with Radeon Instinct”. TechReport. 2017년 8월 9일에 원본 문서에서 보존된 문서. 2016년 12월 12일에 확인함.

[11] “Radeon Instinct MI6”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}

[12] “Radeon Instinct MI8”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}

[anand_vega-13] Smith, Ryan (2017년 1월 5일). “The AMD Vega Architecture Teaser: Higher IPC, Tiling, & More, coming in H1'2017”. Anandtech.com. 2017년 1월 10일에 확인함.

[14] “Radeon Instinct MI25”. 《Radeon Instinct》. AMD. 2017년 6월 22일에 확인함. ^{[깨진 링크(과거 내용 찾기)]}

[1]

[2]

[3]

[4]

[5]

[6]

[a]

[b]

[c]

[d]

[7]

[8]

[9]

[10]