Radeon의 숨겨진 힘, ROCm 으로 깨워보자! > 배틀리뷰

본문 바로가기


배틀리뷰

그래픽 | Radeon의 숨겨진 힘, ROCm 으로 깨워보자!

페이지 정보

작성자 배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일17-03-29 16:48 조회3,950회 댓글20건

본문

본 글은 AMD의 ROCm 의 소개와 함께 실제 환경 구축 과정을 단계별로 따라할 수 있도록 기획, 구성되었습니다.

GPU 컴퓨팅의 삼국지 

우리에게 익숙한 3개의 회사 Intel, AMD, 그리고 NVIDIA 가 데스크탑 PC 시장 이외의 전장에서 격돌하고 있는 곳이 있으니 그곳이 바로 HPC (High Performance Computing) 분야입니다. 다른 분야의 경우 비슷한 방식의 제품을 가지고 서로 경쟁하는 경우가 많은 가운데 HPC시장에서는 비메모리 반도체 분야의 정점을 찍고 있는 위의 세 회사는 각자 가장 자신 있는 방식들로 경쟁을 이어가고 있습니다. 본론에 들어가기 앞서 현재 3사에서 추구하는 HPC 시장을 간략히 짚고 넘어가보겠습니다.

 
NVIDIA는 오래 전부터 CUDA와 함께 자사 GPU 성능을 이용할 수 있는 제품을 지속적으로 출시하고 있습니다. 최근에 출시된 TESLA P100 제품의 경우 카드 1장에 5Tflops(Double Precision)의 성능을 가지고 있고 8장을 함께 사용할 경우 이론적으로 최대 40TFLOPS의 성능을 제공합니다. 또한 NVLink라는 GPU 전용 버스를 통해 GPU 상호간 데이터 전송시 공유 메모리 문제를 해결하고 진정한 의미의 클러스터를 구현하였습니다.

 

 

48f7ea5fda7a8c4ee75f8610faa34794_1490771 

 [출처: NVIDIA® NVLink TM High-Speed Interconnect: Application Performance, 2014 NVIDIA, whitepaper] 

그러나 GPU 만으로는 프로그램을 실행할 수 없기에 x86이나 PPC 같은 다른 플랫폼이 필요합니다.  GPU간의 통신이 아닌 여러 대의 서버를 이용한 환경에서 필요한 인터페이스는 인텔이나 멜라녹스 같은 경쟁사 솔루션을 이용해야 하는 문제가 있고,  NVLink는 독자규격이기에 GPU간의 통신에만 사용될 수 있으며 CPU와의 통신은 아직 PCI-E를 이용해야 하고, 상호간 Uniformed 메모리를 지원하지 못하는 한계가 있습니다. 최근 IBM에서 자사의 PowerPC에 NVLink를 탑재하여 GPU와 CPU간의 NVLink통신을 지원하는 서버를 출시하며 이런 한계들을 극복해 가려는 시도를 하고 있습니다. (참고, IBM : http://www-03.ibm.com/systems/power/hardware/s822lc-hpc/)
 
Intel의 경우는 폭넓은 분야를 선도하는 기업답게 프로세서의 성능뿐 아니라 저장소, 네트워크등 전반적인 부분에 신경 쓰는 모습입니다. 프로세서의 성능 부분에서는 60개 이상의 코어와, 512bit의 SIMD 레지스터(AVX512)로 무장한 제온 파이를 출시하였고, 스토리지 부분에서도 NVMe 기반의 SSD들은 물론 조만간 3DXpoint 기술을 이용한 NVRAM(비휘발성 메모리)들도 곧 출시 될 예정입니다. 또한 네트워크에서는 기존 Infiniband 보다 더 넓은 대역폭과(100Gbps) 더 낮은 레이턴시를 지원하는 Omni Path 아키텍쳐 또한 이미 출시가 되었습니다.  거기에 얼마전 FPGA 를 주력으로 하는 Altera마저 인수하였고 조만간 CPU 안에 FPGA 탑재 계획을 발표하였습니다. ( 참고, http://www.intel.com/content/www/us/en/products/processors/xeon-phi/xeon-phi-processors.html )
 
다만 인텔의 라인업은 프로세서의 연산능력뿐 아니라 네트워크 레이턴시나 특정 작업의 offload가 중요한 초대규모 시스템에서 매우 효율이 좋지만 단일CPU의 물리적인 연산능력이 GPU보다 떨어지는 한계를 가지기에, 중소규모의 솔루션 구축시에는 GPU를 활용한 클러스터 시스템과 비교에서 경쟁력이 다소 떨어지게 됩니다. 
 
AMD 의 경우 NVIDA의 NVLink 와 같은 고속 인터페이스, 인텔처럼 다양한 구성(네트워크,스토리지)은 없지만 CPU와 GPU - 이 두가지 핵심적인 무기를 모두 갖추고 있기에 둘의 시너지를 최대화 할 수 있는 방향으로 특색 있는 환경을 제공합니다. HSA(Heterogeneous System Architecture)가 바로 그것입니다.

 

48f7ea5fda7a8c4ee75f8610faa34794_1490771 

 

APU를 통한 HSA 아키텍처의 구성, 출처: AMD 웹사이트 http://www.amd.com/en-us/innovations/software-technologies/compute-cores 
 

HSA가 아닌 환경에서 CPU와 GPU는 데이터 처리 방식이 다르기 때문에 메모리를 공유할 수 없었습니다. 즉 GPU가 처리 할 내용이 있으면 메인 메모리에 있는 데이터를 GPU 메모리로 복사한뒤, OS의 장치 드라이버를 통해 작업을 수행하라고 명령을 전달하는 방식이었습니다. 그렇기 때문에 몇 가지 문제점이 있었습니다. 첫째는 CPU와 GPU 상호간의 메모리 영역을 사용 할 수 없다는 것, 둘째로 항상 드라이버를 통해 작업이 진행되다 보니 레이턴시가 높아지는 것입니다.


반면 HSA 표준 기반의 시스템에서는 CPU와 GPU가 상호 간의 메모리에 접근 할 수 있고(HuMA heterogeneous  uniformed Memory Access), 매번 디바이스 드라이버를 통해 GPU에 접근하는것이 아니라 프로그램에서 직접적으로 GPU를 액세스 할 수 있는 환경(Hq, heterogeneous queuing)을 제공합니다.

 

48f7ea5fda7a8c4ee75f8610faa34794_1490771 

 

HSA 시스템에서의 CPU 와 GPU의 작업 수행. 출처: https://streamcomputing.eu/blog/2014-02-05/heterogeneous-systems-architecture-hsa-the-tldr/

 

​AMD의 HPC 솔루션은 근본적으로 HSA 표준을 만족시키며 플랫폼에 구애되지 않고 CPU 와 GPU 를 모두 효과적으로 활용할 수 있는 범용성을 가지는 것은 물론 오픈 소스를 지향하고 있기에 업계의 주목을 받고 있습니다.

ROCM,  Radeon Open Computing platform


이제 소개해드릴 ROCm은 GPU를 활용한 HPC 및 울트라 스케일링 컴퓨팅 플랫폼으로 UNIX의 선택과 집중, 미니멀리즘, 그리고 모듈화 철학을 지향하는GPU 컴퓨팅을 위한 소프트웨어 개발 환경입니다. 오픈 소스를 선호하는 AMD답게 맨틀 API와 Linux 그래픽 드라이버처럼 모든 소스가 공개되어있습니다.
 
ROCm은 다음 3가지 요소로 구성되어있습니다.


1. HSA 환경을 제공하는 플랫폼(리눅스 드라이버 및 런타임)
2. HCC HSA 컴파일러
3. HIP
 
ROCm 구현을 위한 하드웨어 요구사항은 다음과 같습니다만 최근 ROCm v1.4 의 발표와 함께 더 많은 GPU 지원이 추가되었고 최근 발표된 RYZEN CPU 도 곧 지원하게 됩니다.


 *  PCI-express Atomics 가 지원되는 GPU(CPU와 직접 연결되는 Lane 사용을 권장)
 *  PCI-Express 3.0 + PCI-Express Atomics를 지원하는 CPU(Intel(하즈웰 이상)과 AMD( 모두 포함)
 
보다 자세한 내용은 다음의 프로젝트 페이지를 참고해 주시기 바랍니다.
https://github.com/RadeonOpenCompute/ROCm
 
 
ROCm 의 세부 구성요소 살펴보기

HIP
세대가 바뀔 때 마다 각 제조사의 하드웨어 성능 차이는 늘 있어왔습니다. A사의 제품이 한 시대를 풍미하였다 하더라도 금새 B사에서 그것을 뒤집어 버리는 하드웨어를 출시하는 일이 비일비재 합니다. 그리고 하드웨어 리소스를 가져다 쓰는 개발자 입장에서 이렇게 변경되는 하드웨어마다 코드를 새로 짜야 하는 것은 거대한 리스크 입니다. 비슷한 개발 환경이라면 그 시간이 단축되겠지만 그렇지 않다면 엄청난 시간과 노력을 투자해야 합니다. 만약 쉽게 포팅을 진행하더라도 코드의 안전성 검증이라는 문제는 여전히 남아있습니다. 이런 문제를 해결하기 위해 OpenCL과 같은 플랫폼을 가리지 않는 중간 언어들이 유행하고 있지만 이미 짜놓은 CUDA 코드가 OpenCL 코드로 자동 변환되는 것도 아니고 각 하드웨어 제조사에서 제공하는 언어보다 빠르게 최신 기능들을 지원하는 것도 아닙니다.

 

 

48f7ea5fda7a8c4ee75f8610faa34794_1490771 

 



ROCm에 포함되어있는 HIP는 이런 문제들을 유연하게 대처할 수 있는 도구입니다.  HIP는 CUDA코드를 C++코드로 변환시켜주는 HIPify와 새로 작성된 C++코드를 NVIDIA 혹은 AMD 환경에서 동작 가능하도록 컴파일 해주는 HIPCC로 구성이 되어있습니다. 쉽게 말해 HIP로 코드를 작성한 경우 NVIDIA와 AMD의 GPU에 맞는 바이너리로 별도의 코드 수정 없이 바로 컴파일 하여 사용 할 수 있습니다. 

 

HCC 

a878092f359f8939811f09a945a0db22_1492397


 

 

 
HCC는 HSA와 c/c++ 표준 라이브러리를 포함하는 컴파일러입니다. 프로그램 코드를 HCC를 이용해 컴파일 하면 HSA표준에서 지원하는 모든 기능들을 이용 할 수 있습니다.
 
HCC를 사용하기 위해서는 위에 소개에서 언급해 드린 하드웨어 요구사항을 충족해야 합니다. 현재까지는 인텔 하즈웰/AMD 라이젠 이상의 플랫폼, AMD FIJI이상의 GPU구성과 ROCm 커널에서만 동작합니다.
 
Kernel
ROCm 플랫폼을 이용하기 위해서 Linux Kernel이 제공됩니다. 현재 Ubuntu 14.04/16.04, Fedora 23용으로 빌드된 커널을 제공하며 git을 통해 소스 코드 또한 받아보실 수 있습니다.
 

 

실전! ROCm 환경 구축하기


설치
우분투(Ubuntu) 16.04에서 직접 ROCm을 설치하고 테스트 해보도록 하겠습니다.  Ubuntu 16.04 Desktop 64비트 버전을 설치하였으며 이번에 사용된 하드웨어는 다음과 같습니다.

 

48f7ea5fda7a8c4ee75f8610faa34794_1490772 

 

ROCm은 Ubuntu 16.04에 Repository를 추가하면 간단하게 설치가 가능합니다.  보고 따라하는 것만으로도 직접 해보실 수 있도록 터미널에 입력하는 명령어를 검정색 박스에 별도 표기하였습니다.

자 이제 본격적인 설치에 들어가보겠습니다. 먼저 gpg.key를 다운로드하고 ROCm Repository를 시스템에 추가합니다.

 

  

48f7ea5fda7a8c4ee75f8610faa34794_1490775
48f7ea5fda7a8c4ee75f8610faa34794_1490775 

 

정상적으로 Repository가 추가되었는지 다음 명령어를 통해 확인 가능합니다.

 

48f7ea5fda7a8c4ee75f8610faa34794_1490775
48f7ea5fda7a8c4ee75f8610faa34794_1490775 

이제  apt db를 갱신하고 rocm을 설치합니다. 설치가 완료되면 설치된 ROCm커널로 부팅하기 위하여 시스템을 다시 시작합니다.

 

48f7ea5fda7a8c4ee75f8610faa34794_1490775
48f7ea5fda7a8c4ee75f8610faa34794_1490775 

 

설치 확인

시스템을 다시 시작하고 나면 uname 명령어를 이용해 ROCm 커널로 부팅되었는지 확인합니다.


 [ 기존커널 ] 의 경우 다음과 같이 표시됩니다.


48f7ea5fda7a8c4ee75f8610faa34794_1490775

 

 

[ROCm커널] 이 정상적으로 올라온 경우 다음과 같이 확인됩니다.

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490775
7388bbedf52a6b3ef220c9a0fe03a01c_1490775 

설치가 정상적으로 되었는지 확인하기 위해 ROCm패키지 안에는 Vector_cpoy라는 프로그램의 소스코드가 포함되어있습니다. 아래와 같이 컴파일 하고 실행하면 각 항목별로 테스트를 진행하고 결과를 출력해 줍니다. 여기까지 이상없이 진행되었다면 ROCm이 정상적으로 설치된것입니다.

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490775 

위의 내용까지 진행되었다면 ROCm 의 기본적인 설치와 사용 환경은 갖춰진 셈입니다. 그럼 이 ROCm 이 Radeon R9 Nano 의 성능을 활용할 수 있는 준비가 되었는지 다음 과정을 통해 확인해보겠습니다.​

 

MIXBench  실행
Mixbench는 GPU의 연산 성능을 측정하기 위한 간단한 벤치마크입니다. 정수형과 실수형(single, double precision)데이터 처리 성능을 측정하며 NVIDIA의 CUDA와 OPENCL 그리고 AMD의 HIP까지 모두 지원을 합니다. Mixbench는 apt가 아닌 git을 통해서 소스코드를 다운받고 직접 컴파일 해서 사용합니다.  

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490775 

 Mixbench 의 Github 페이지, https://github.com/ekondis/mixbench


먼저 apt를 이용해 git을 설치합니다.

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490775
7388bbedf52a6b3ef220c9a0fe03a01c_1490775 

 

Git에서 mixbench의 소스 코드를 받아옵니다.

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490775
7388bbedf52a6b3ef220c9a0fe03a01c_1490775 

 

컴파일
Mixbench를 컴파일 하기전에 vi와 같은 에디터를 이용해 Makefile을 수정해야 합니다. CUDA/OPENCL/HIP 셋중에 무엇을 사용할지 Makefile에서 미리 정의하면 해당 플랫폼에 맞는 바이너리를 생성합니다. CUDA_INSTALL_PATH와 OCL_INSTALL_PATH를 주석을 이용해 disable하고 최상단에 HIP_PATH항목을 추가해 줍니다. HIP가 설치된 디렉터리는 /opt/rocm/hip입니다. 

 

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490776
7388bbedf52a6b3ef220c9a0fe03a01c_1490776 

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490776 

 

Make 를 이용해 컴파일 하면 mixbench-hip-alt와 mixbench-hip-ro가 생성됩니다. 이 두가지를 실행하면 각각 다음과 같은 벤치마크 결과가 나옵니다.

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490776
7388bbedf52a6b3ef220c9a0fe03a01c_1490776 

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490776
7388bbedf52a6b3ef220c9a0fe03a01c_1490776 

 

 

결과를 보면 정수형(integer)에서 약 8TFLOPS, 실수형(Double precision)에서 약 500GFLOPS 정도의 성능이 나오는데, 이 수치는 Wikipedia AMD GPU List 의 표에 기재된 Processing Power 와 비교해보면 실제 GPU의 스펙 수준의 성능 임을 확인 할 수 있습니다!

 

 

b840b25b6b0801d97d531a2961342cac_1490790
 

Wikipedia 의 AMD graphics processing units 페이지, ​https://en.wikipedia.org/wiki/List_of_AMD_graphics_processing_units#Radeon_R5.2FR7.2FR9_300_Series

​다음은 각각 Radeon RX480, Radeon R9 FURY X의 Mixbench 결과값이며 표로 종합한 내용은 마지막 그래프와 같습니다.

b840b25b6b0801d97d531a2961342cac_1490797 

b840b25b6b0801d97d531a2961342cac_1490797

b840b25b6b0801d97d531a2961342cac_1490797

a878092f359f8939811f09a945a0db22_1492397


당신의 Radeon RX480 도 약 5.7TFLOPS 의 단정밀도 연산 능력을 가지고 있다!

HIPify를 이용한 CUDA 코드 변환
HIPify는 위에 소개드린대로 CUDA 코드를 HIP코드로 변환시켜주는 도구입니다. 개발팀에서는 별다른 수정없이 완전한 코드 변환을 목표로 한다고 합니다. 직접 테스트 해본 결과 완벽하지는 않지만 대부분의 코드가 약간만 수정하면 바로 실행 가능한 수준으로 변환되었습니다. 아래는 ROCm에 샘플로 제공되는 Squre.cu CUDA소스파일을 HIPify를 통해 HIP C++파일로 변환한뒤 diff 명령어를 이용해 비교해 본 사진입니다. 코드를 보면 CUDA함수들이 HIP 함수들로 치환된 것을 확인 할 수 있습니다. 

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490776
7388bbedf52a6b3ef220c9a0fe03a01c_1490776 

 

Radeontop을 이용한 리소스 모니터링
마지막으로 하나 더 소개시켜 드리고 싶은 것은 리소스 모니터링 프로그램인 Radeontop입니다. 실제 GPU의 리소스가 얼마나 사용되고 있는지 상세하게 출력해주는 프로그램입니다. 역시 git을 통하여 소스코드를 받아와 컴파일 해야 합니다. 그리고 앞서 설치했던 프로그램보다 조금 더 많은 라이브러리들을 미리 설치해야 합니다. 

 

 

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490776 Github 의 Radeontop 페이지, https://github.com/clbr/radeontop

 

 

먼저 apt-get을 이용해 아래 라이브러리들을 설치합니다.

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490777
7388bbedf52a6b3ef220c9a0fe03a01c_1490777 

이어서 git을 이용해 radeontop의 소스 코드를 받아와 make를 이용해 컴파일 합니다.

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490777 

 

생성된 radeontop 바이너리를 실행합니다.

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490777
7388bbedf52a6b3ef220c9a0fe03a01c_1490777 

 

다음과 같이 모니터링이 가능합니다.

 

7388bbedf52a6b3ef220c9a0fe03a01c_1490777 

 

 

맺으며


딥 러닝, 수치연산/시뮬레이션과 같은 엄청난 리소스를 요구하는 분야들이 주목 받으면서 다양한 고성능 하드웨어들이 연이어 출시되고 있습니다. 그리고 하드웨어 성능이 올라가는 만큼 그 하드웨어 리소스를 활용하는 개발자들의 고민도 깊어지고 있습니다. NVIDIA의 경우 CUDA코드를 다른 플랫폼으로 이식할 수 없는 한계로 인해 플랫폼 종속적일 수 밖에 없습니다. 다른 제조사에서 더 좋은 제품을 출시하였다 하더라도 코드를 다시 개발해야 하는 리스크로 인해 신규 하드웨어 도입을 주저 할 수 밖에 없게 됩니다. Intel 은 x86기반의 범용 프로세서만 가지고 있습니다. 낮은 클럭에 코어가 많은 제품도 있고 높은 클럭에 코어 수가 적은 제품도 있습니다. 원하는 상황에 맞추어 골라 쓸 수 있다는 장점이 있지만, 퍼포먼스를 온전히 활용하기 위하여 하드웨어 구성부터 코딩 방법까지 신경 써야 할 부분이 너무 많습니다. 게다가 GPU와 CPU의 리소스를 동시에 사용하고자 한다면 순수하게 CPU 혹은 GPU만을 사용할 때 보다 너무 많은 것들을 고려해야 합니다.

AMD가 제안하는 ROCm은 이런 고민을 충분히 해결해 줄 수 있는 플랫폼입니다. 하나의 코드로 플랫폼을 가리지 않고 동작하는 바이너리를 만들 수 있다는 것 하나만으로도 HPC 환경을 구축하고자 하는 개발자는 물론 사용자들에게도 고려할 만한 가치가 충분합니다. ROCm이 굳건히 자리를 잡기 위해서는 분명 경쟁사를 압도하는 절대적인 하드웨어 성능과 기능, 그리고 다른 유저들을 쉽게 흡수할 수 있는 라이브러리가 지속적으로 뒷받침 되어야 합니다.

이에 대해서는 AMD 가 얼마 전 발표한 Radeon Instinct 와 MIOpen 라이브러리를 기대해볼 수 있겠습니다. Machine Learning, Deep Learning 및 AI 를 위한 GPU 가속기인 Radeon Instinct 는 올해 새로운 GPU 아키텍처인 Vega 기반의 제품이 출시 예정이며 함께 발표된 MIOpen 은 Deep Learning 라이브러리 입니다. 현재 알려진 바로는 Radeon Instinct 의 MI25 의 경우 FP16 기준 25TFLOPS 의 성능을 보여줄 것으로 예상되고 있습니다.

a878092f359f8939811f09a945a0db22_1492397


 

​이번에 소개해드린 ROCm 을 통해 데스크탑 PC 에 장착된 Radeon GPU 의 강력한 연산 능력을 손쉽게 사용할 수 있음을 알리는 계기를 마련하고 실제 ROCm 을 통한 Radeon GPU 연산 성능이 활용되는 사례가 생겨났으면 하는 바람을 가지며 마치고자 합니다.

 

 

참고 자료:

[Git]
ROCm : https://github.com/RadeonOpenCompute/ROCm
Mixbench : https://github.com/ekondis/mixbench
Radeontop : https://github.com/clbr/radeontop
[Wikipedia]
AMD Radeon Rx 300 series : https://en.wikipedia.org/wiki/AMD_Radeon_Rx_300_series
[etc.]
AMD GPUOPEN : http://gpuopen.com
NVIDIA DGX-1 : http://kr.nvidia.com/object/deep-learning-system-kr.html
Intel HPC : http://www.intel.co.kr/content/www/kr/ko/high-performance-computing/server-reliability.html
HSA Foundation : http://www.hsafoundation.com/


 

작성일 제목 조회수 추천 / 비추천
2018-04-20 2세대 Ryzen 리뷰 관련 기습 이벤트 안내 [44] 462 13 / 0
2018-04-20 AMD, 2세대 라이젠(Ryzen) 데스크톱 프로세서 전세계 공식 출시 [17] 1031 3 / 0
2018-04-19 2세대 Ryzen 2700X 와 2600X 프로세서 [92] 4289 24 / 0
2018-04-19 BIOSTAR RACING B360 GT3S 와 B360MHD PRO 마더보드 [12] 224 5 / 0
2018-04-19 AMD EPYC™ 프로세서, CRAY 슈퍼컴퓨터 제품군에 탑재 출시 [15] 811 4 / 0
[ - http://hwbattle.com/bbs/board.php?bo_table=hottopic&wr_id=5971 ]
추천 12 비추천 0

댓글목록

엉거니님의 댓글

엉거니 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

뭔지 모르겠네요... 어렵어렵..
중간에 altera얘기가 나와서 재작년에 Quarters 프로그램을 이용하여 FPGA 보드에 verilog 언어로 코딩하여 실험하던게 기억났네요.. 이런 글 보면 다 알고 싶은데 너무 어렵네요.

무한창공님의 댓글

무한창공 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

음, 예전에 마이크로소프트웨어 컴퓨터잡지보던 생각 나네요. 그래픽카드가 채굴용으로 사용된다고 하는데 이런 기능을 이용할 수 있기 때문이겠지요?

블러디루나님의 댓글

블러디루나 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

내용은 복잡하지만, 전체적인 맥락은 일단 기존 인텔, 엔비디아 플랫폼과는 달리, 오픈소스를 활용해서 딥러닝과 각종 연산분야에서 AMD는 통합플랫폼을 지향하고 있고, 현재 이 플랫폼은 거의 모든 환경(하스웰 이상의 CPU와 AMD 피지 이상의 GPU)에서 공통적으로 활용이 가능하므로, 어느정도 플랫폼이 안정화만 된다면, 앞으로 상당히 전망이 좋다는 의미인듯 하군요~+_+
확실히 CPU에서 GPU의 메모리단을 활용할 수 있고, GPU에서 CPU의 메모리를 바로 인식할 수 있다면, 명령체계에서 상당한 메리트로 보입니다. 로딩속도 자체도 획기적으로 줄어들 것 같구요~+_+
하지만, 엔비디아는 소스코드에 대해서 상당히 폐쇄적인데,  과연 효율이 어느정도 나와줄지 궁금하군요~+_+

배틀천칭님의 댓글

배틀천칭 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

소프트웨어 개발자들에게 상당히 유용한 메카니즘일까나요.
여튼 일반인인 저로선 사용할 일은 없겠죠.
정성스런 리뷰 고맙습니다.^^

날마다삑사리님의 댓글

날마다삑사리 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

읽기는 했는데 제가 이해력이 부족하여 전부이해는 못했내요 ,,부분부분.....
정성스런 리뷰 잘 보았습니다 ,,수고 하셨습니다 뉴스님...

빨간늑돌이님의 댓글

빨간늑돌이 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

헐....마지막만 봐서 잘은 모르겠는데 이게 라데온 카드에서 쿠다 프로그램을 돌아갈수있게 해주는건가여?

댓글을 다시려면 로그인이 필요합니다. 로그인 하러가기

배틀리뷰 목록

Total 94건 1 페이지
제목 글쓴이 날짜 조회
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2018-04-05
15:33:03
2791
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2018-03-16
12:13:49
2858
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2018-01-28
09:49:31
3697
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2018-01-14
18:24:56
3628
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2018-01-14
18:53:53
1478
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-12-22
17:06:42
2306
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-12-08
17:39:51
2089
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-11-21
12:10:55
2555
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-11-13
20:46:47
13125
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-11-14
18:32:09
1552
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-10-29
11:18:39
1924
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-11-02
19:42:21
2849
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-10-27
22:17:42
2309
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-10-16
16:29:33
2705
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-09-22
11:35:37
5369
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-09-15
12:32:04
2695
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-09-01
16:50:54
4298
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-08-26
02:05:37
3014
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-08-18
23:45:10
5007
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-08-14
12:47:43
17176
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-07-27
01:46:34
3281
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-07-21
18:40:54
2240
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-06-13
17:36:58
6577
배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-05-28
17:10:42
2362
배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-04-26
18:34:45
2902
배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-04-18
21:51:06
10689
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-03-29
20:51:48
6884
배틀인포 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-03-29
20:34:38
3753
배틀뉴스 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-03-29
16:48:56
3951
배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2017-03-14
17:05:39
6394
게시물 검색
제목

접속자집계
오늘
10,594
어제
10,801
최대
24,782
전체
7,413,776
사이트소개 개인정보취급방침 서비스이용약관 문의 & 제휴 메뉴 및 포인트 Update 하배 인스타그램
Copyright © www.hwbattle.com All rights reserved.
상단으로
모바일 버전으로 보기