[DX12] Next technologies in Ashes of the Singularity > 배틀리뷰

본문 바로가기


배틀리뷰

게임 & 소프트웨어 | [DX12] Next technologies in Ashes of the Singularity

페이지 정보

작성자 배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일16-03-31 00:03 조회3,017회 댓글29건

본문

▣ 다이렉트X 12로 한계돌파! 애쉬 오브 더 싱귤러리티

다이렉트X 12 기반으로 제작되거나 패치를 통해 지원하는 게임들이 늘어나고 있지만, 아직도 애쉬 오브 더 싱귤러리티처럼 다양한 핵심기술들을 지원하는 타이틀은 흔치 않습니다.

초창기부터 멀티스레드 효율 증가(Improved Multi-Thread), 비동기 셰이더(Asynchronous Shader) 기술로 현존 그래픽 카드의 성능향상, 다른 종류의 그래픽 카드를 묶어 성능을 높이는 멀티 어댑터(Multi Adpater) 등 다이렉트X 12의 핵심기술들을 지원해 벤치마크용(?) 게임으로 명성을 쌓아온 전적은 대다수의 IT 매니아분들이 인정하고 있는 상황입니다.

물론 애쉬 오브 더 싱귤러리티의 벤치마크 자료는 알파, 베타버전이 바뀔 때 마다 여러차례 공개된 바 있습니다. 하지만 지난 3월 31일 정식출시를 실시하면서 기술적인 부분들의 안정화도 마무리 되었다고 볼 수 있는 시점이니 앞서 살펴본 핵심기능 3가지, 오버헤드 감소, 비동기 셰이더, 멀티 어댑터의 적용이 어떤 결과를 보여줄 지 확인해보는 지면을 가져보고자 합니다.

오버헤드 감소 테스트는 프로세서와 관련된 내용이다 보니 쿼드코어나 옥타코어 이상의 고사양 CPU 에서도 효과가 있는지 확인하기 위해, 멀티어댑터 테스트는 CPU 병목현상으로 인해 그래픽 카드의 성능이 제대로 측정되지 않을 경우를 고려해 14-코어/28-스레드를 지원하는 인텔 제온 E5-2697 v3 시스템으로 진행했으며, 비동기 셰이더 테스트는 일반적인 하이엔드 게이밍 PC 환경을 고려해 인텔 코어 i7-6700K 테스트 시스템을 사용했습니다.

Platform
Specification

테스트 항목 오버헤드 감소, 멀티어댑터 비동기 셰이더(Asynchronous Shader)
프로세서
  Intel® Xeon® E5-2697 v3 (2.6GHz) 코잇
  Intel® Core™ i7-6700K (4.0GHz) 코잇
메모리
  Samsung DDR4-2133 8GB ECC/REG x8 (Total 64GB)
  명인일렉트로닉스
  Samsung DDR3-1600 8GB x2 (Total 16GB)
  명인일렉트로닉스
메인보드
  ASRock X99 Extreme4/3.1 에즈윈
  ASRock Z170 Extreme4 에즈윈
저장장치
  Micron Crucial MX200 1TB 대원CTS
  Micron Crucial MX200 1TB 대원CTS
그래픽 카드
  이엠텍 XENON GeForce GTX 980 Ti SuperJETSTREAM
  SAPPHIRE Radeon R9 Fury X HBM 4GB
  그래픽 카드 라인업 참조 (아래)
파워
  FSP AURUM PRO AU-1000PRO 스파클텍
  FSP AURUM PRO AU-1000PRO 스파클텍
운영체제
  Microsoft Windows 10 Pro 64bit
  Microsoft Windows 10 Pro 64bit






▣ 오버헤드 감소 및 멀티스레드 효율 증가

가장 먼저 살펴볼 다이렉트X 12의 특징은 멀티스레드 효율 증가에 따라 오버헤드가 감소한다는 점 입니다.

기본적으로 다이렉트X 12의 오버헤드 감소는 프로그램의 코드가 아니라 이전버전 다이렉트X의 비효율적인 스레드 활용구조를 개선하기 위한 것입니다. 프로그래밍 단계에서 병렬화 코드를 잘 짜놓은 게임들은 이전버전 다이렉트X API를 사용하더라도 다수의 멀티코어를 활용하는 모습을 볼 수 있습니다.

다만 다이렉트X 11 이하 버전들의 API는 최대 지원 스레드가 4개에 불과하고, 드라이버 단계는 싱글코어에 모든 부하가 집중되기 때문에 오버헤드(병목현상)이 발생합니다. 다이렉트X 12는 더 많은 스레드를 활용할 수 있도록 개선하는 한편, 드라이버 작업까지 병렬화시켜 오버헤드를 줄이고 나아가 더 많은 명령어를 전달할 수 있어 더 적은 시스템 자원으로도 동일한 성능을 낼 수 있게 됩니다.



▲ 게임코드(보라색)의 CPU 점유율은 프로그래밍 코드의 특성에 따라 달라지지만, 다이렉트X API가 차지하는
CPU 점유율(빨간색, 청록색)은 대부분의 게임들이 동일하게 적용됩니다. 흥미로운 점은 다이렉트X 12의 경우
게임코드가 지원하지 않는 CPU 코어까지 활용하기 때문에 멀티코어 지원이 기본적으로 이루어지게 됩니다.


애쉬 오브 더 싱귤러리티는 다이렉트X 12의 특징이 가장 잘 드러나는 게임입니다. 전략 시뮬레이션(RTS) 게임의 특성상 "물량전"으로 일컬어지는 대규모 부대를 조작하는 경우가 흔한데, 유닛을 생산할 때 마다 3D 객체가 늘어나기 때문에 드로우콜의 개수도 덩달아 늘어납니다. 게다가 유닛들 하나하나가 경로찾기, 지도탐색, 경계태세를 구현하려면 끊임없는 CPU 연산이 필요하기 때문에 오버헤드가 발생하기 딱 좋은 장르이기도 합니다.

오랫동안 최적화를 진행해 온 애쉬 오브 더 싱귤러리티의 병렬 프로그래밍은 상당히 훌륭한 편이지만, 그럼에도 불구하고 다이렉트X 11 환경에서는 유닛의 수가 늘어나면 시작하면 오버헤드를 피할 수 없게 됩니다. 개발사인 옥사이드 게임즈(Oxide Games)의 자료에 따르면 8-코어/16-스레드 환경에서도 멀티스레드를 모두 활용하지만, 다이렉트X 11의 특정코어 편중현상으로 인해 CPU 점유율이 100%가 넘는 스레드가 발생하는 것을 볼 수 있습니다.



▲ 개발사인 옥사이드 게임즈가 제공한 8C/16T, DX11 환경의 스레드 분포도입니다. 게임 자체의 병렬화는 잘 되어 있지만
DX11의 비효율적인 워크로드 분배로 특정 코어의 점유율이 100%를 넘으면서 병목현상이 발생할 수 있는 장면입니다.


하드웨어 배틀이 직접 측정한 다이렉트X 11 점유율과 다이렉트X 12 점유율을 보면 두 API의 멀티스레드 효율이 명확하게 드러납니다. 일전의 히트맨에서도 비슷한 결과가 나왔지만, 이번에는 차이가 보다 극명하게 드러나는 것을 볼 수 있습니다. 측정에 사용된 인텔® 코어™ i7-6700K는 스레드 수는 적지만 작동속도가 더 빠르게 때문에 병목현상은 나타나지 않았습니다.

하지만 멀티스레드를 효율적으로 활용하는 다이렉트X 12가 더 낮은 클럭 스피드와 CPU 점유율로도 동일하거나 더 높은 성능을 내어주기 때문에 갑작스럽게 작업량이 늘어나더라도 프레임 드랍이 발생할 확률이 줄어듭니다. 또한 하이퍼 스레딩(Hyper Threading)을 지원하는 코어™ i3와 같은 메인스트림 프로세서는 직접적인 성능 향상과도 관계가 있습니다.



▲ 하드웨어 배틀이 인텔® 코어™ i7-6700K (4C/8T) 프로세서로 직접 측정한 DX11 / DX12 스레드 분포도입니다.
DX12는 모든 스레드가 고른 분포를 보이고 있지만, DX11 환경에서는 특정 스레드에 많은 부하가 걸리는 모습입니다.


아래 자료는 이론적인 특성과 별개로 실질적으로 게임 플레이에 미치는 영향을 확인하기 위해 14-코어/28-스레드 사양의 인텔® 제온® E5-2697 v3 프로세서의 활성화 코어수를 바꿔가면서 테스트 한 결과입니다. 또한 물리코어(Native Multi Thread)와 논리스레드(Simultaneous Multi Thread)의 차이도 확인할 수 있도록 하이퍼 스레딩 기술 적용 / 비적용 결과도 함께 측정했습니다.

얼핏 보기엔 쿼드코어부터 병목 현상이 해결된다고 볼 수도 있겠지만, 인텔® 코어™ i3 처럼 듀얼코어라도 4-스레드 환경만 갖춰지면 충분한 성능을 내는 것을 확인할 수 있습니다. 즉, 애쉬 오브 더 싱귤러리티는 4-스레드에 최적화 되었으며 더 많은 코어를 가진 CPU를 사용할 경우 각 스레드마다 작업량을 고르게 분산시켜 병목현상을 방지하고 CPU 사용량을 낮춰 전력효율을 높이게 됩니다.







▲ 전략 시뮬레이션의 꽃, 물량전을 부드럽게 구현하려면 고성능 CPU는 물론이고, 게임엔진의 멀티스레드 활용능력도 중요합니다.




▣ 멀티어댑터 (Explict Multi-Adpater)

멀티어댑터는 다른 브랜드의 그래픽 카드를 쓰면서 성능을 높일 수 있다는 점에서 매력적인 기술입니다. 특정 브랜드에 최적화된 게임이라도 해당 그래픽 카드를 주력(Primary)으로 설정하면 조합 특성에 따라 성능측정 결과가 달라지는 모습을 보여주기 때문입니다.

그래픽 카드 조합 순서와 더불어 다이렉트X 12의 핵심적인 기술인 비동기 셰이더(Asynchronous Shader) 적용여부도 결과에 영향을 미치기 때문에 게임에 따라 성능적으로 더 유리한 조건을 찾을 수 있을 것으로 보입니다.

애쉬 오브 더 싱귤러리티의 경우 비동기 셰이더 기술 On / Off를 지원하기 때문에 하드웨어 스케줄러가 내장된 AMD Radeon™ 시리즈를 주력으로 설정했을 때 전반적으로 높은 성능을 보였습니다. 반대로 소프트웨어 스케줄링 기반의 NVIDIA GeForce® 시리즈를 주력으로 설정할 경우 조합에 따라 성능 변동이 크게 나타났습니다.

특이사항으로는 Radeon™ 시리즈만으로 멀티 어댑터를 구성할 경우 비동기 셰이더 Off 상태에서 성능이 떨어지는 것으로 나타났고, GeForce® 시리즈는 조합 순서에 관계없이 비동기 셰이더 On 상태일 경우 고해상도 성능이 감소하는 것으로 나타났습니다.



▲ 드로우콜이 많은 구간(Heavy Batches)에서 측정된 초당 프레임 수(fps, Frame per second) 결과입니다.




▣ 비동기 셰이더 (Asynchronous Shader)

비동기 셰이더는 다이렉트X 12 발표 당시 많은 관심을 받은 기술입니다. 특히 다이렉트X 12 이전 버전에서 하드웨어 사양에 비해 아쉬운 성능을 제공했던 GCN(Graphic Core Next) 기반 그래픽 카드들의 성능을 대폭 향상시켜 주는 것으로 유명합니다. AMD는 다이렉트X 12의 핵심 개발자(?)의 역할을 맡은 덕분에 자사의 하드웨어 스케줄러인 비동기 컴퓨트 엔진(ACE)을 그대로 활용할 수 있었기 때문입니다.

기존 그래픽 카드들은 명령어 실행구조를 단순화하면서 더 많은 데이터를 처리할 수 있도록 여러가지 연산작업을 포함한 하나의 명령어를 만든 뒤, 일정한 규칙에 따라 명령어에 포함된 작업을 분류하는 컴파일러 형태의 소프트웨어 스케줄러를 활용했습니다. 이러한 연산 형태는 일정한 형태의 명령어를 대량으로 처리할 수 있기 때문에 효율성이 높았습니다.




하지만 최신 그래픽 연산의 경우 텍스처 매핑과 셰이딩만 반복되는 작업이 아니라 레이-트레이싱, 테셀레이션과 같은 범용 컴퓨팅 연산기능이 지속적으로 추가되고 있기 때문에 일괄 명령어 규칙에 맞게 최적화하는 작업이 점차 힘들어지고 있으며, 순차적으로 실행되기 때문에 명령어 해독에 실패할 경우 밀려있는 작업들이 전부 지연되는 문제가 있습니다.

비동기 셰이더 방식은 하드웨어 스케줄러를 지원해 실시간으로 다양한 형태의 명령어들을 해독하고, 그 중 성공한 작업이 먼저 실행될 수 있도록 비순차적으로 배열하는 것이 가능합니다. 덕분에 특정 명령어의 해독이 늦어져도 다른 작업들은 계속 처리되기 때문에 병목현상이 발생할 확률이 대폭 줄어들고, 전반적인 응답시간도 빨라져 성능이 대폭 상승하게 됩니다.

애쉬 오브 더 싱귤러리티에 포함된 벤치마크는 All Batches(전체구간), Normal Batches(일반부하), Medium Batches(중간부하), Heavy Batches(최대부하) 결과가 초당 프레임 수(fps)로 표시되며, 그래프에는 평균 프레임으로 볼 수 있는 전체구간, 최대 프레임에 가까운 일반부하, 그리고 최소 프레임에 근접하는 최대부하값을 표시했습니다. 중간부하값과 전체구간값은 비슷한 결과가 측정되므로 참고값으로 활용하실 수 있습니다.


Ashes of the Singularity 그래픽 성능 그래프 (1920x1080 해상도)


Ashes of the Singularity 그래픽 성능 그래프 (2560x1440 해상도)


Ashes of the Singularity 그래픽 성능 그래프 (3840x2160 해상도)




▣ 애쉬 오브 더 싱귤러리티, GPU의 미래를 보여주다.

지금까지 애쉬 오브 더 싱귤러리티를 통해 다이렉트X 12의 핵심 기능들을 모두 살펴보았습니다.

가장 먼저 살펴본 오버헤드 감소효과는 실질적으로 하드웨어 제한에 막혀 신규 타이틀 개발이 뜸했던 실시간 전략 시뮬레이션(RTS) 장르에 숨통을 틔워주는 역할을 훌륭하게 수행해냈습니다. 다이렉트X 11 기반 게임들이 멀티스레드 지원의 과도기적인 모습을 보여줬다면, 다이렉트X 12 기반 게임들은 멀티스레드 기술의 완성된 모습이라고 할 수 있겠습니다.

멀티어댑터는 기존 멀티 GPU 기술의 많은 제약을 대폭 완화시켜 게이머들의 부담을 덜어줄 것으로 보입니다. 특히 게임 개발사들이 GPU 개발사와 협력을 통해 최적화를 진행하면서 멀티 GPU 기술의 지원여부나 효율성이 크게 달라지는 문제로 인해 멀티 GPU 를 꺼리는 경우가 많았지만, 다이렉트X 12 멀티 어댑터 기술을 지원하는 게임 엔진이 늘어나면 멀티 GPU 기술의 부정적인 시선도 점점 개선될 것으로 기대됩니다.



▲ 비동기 셰이더(Asynchronous Shader) 소개 영상, 다른 명령어로 전환시 지연시간을 줄여 처리성능을 높입니다.


위의 두 가지 기술만으로도 다이렉트X 12 는 충분히 제 몫을 하고 있지만, 실질적으로 가장 기대받고 있는 기술은 다름아닌 비동기 셰이더입니다. 애쉬 오브 싱귤러리티를 통해 비동기 셰이더가 그래픽 카드의 성능을 한차원 끌어올릴 수 있다는 것이 검증된 지금, AMD Radeon™ 시리즈는 차세대 그래픽 코어(GCN, Graphics Core Next)라는 코드명에 걸맞는 명예회복을 한 셈입니다.

CPU 업계에서 AMD가 x86-64 표준을 확립하면서 64bit 시장을 열었듯이, 그래픽 카드 업계에서도 비동기 셰이더 기술로 새로운 구조의 GPU 시장을 확립하게 될지 사뭇 기대가 됩니다.


▲ 게임, 그래픽, 기술의 미래를 보여준 애쉬 오브 더 싱귤러리티, 어쩐지 앞으로도 자주 보게 될 것 같은 느낌이 듭니다.
작성일 제목 조회수 추천 / 비추천
2018-01-08 AMD@CES2018 [38] 4074 14 / 0
[ - http://hwbattle.com/bbs/board.php?bo_table=hottopic&wr_id=1875 ]
추천 3 비추천 0

댓글목록

마낀쓱이님의 댓글

마낀쓱이 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

예전 벤치를 봐서 알고는 있었지만 역시 dx12적용시 AMD 성능향상은 엄청나군요 쿄쿄쿄
잘 봤습니다 폴라리스도 잘 나와주길 쿄쿄쿄
근데 한가지 리뷰보면서 유튜브 동영상 부분에서 스크롤 내리면 화면이 이상하게 보입니다
스크롤 상하 이동시 동영상도 같이 상하 이동하는 현상이 저만 그런건지 쿄쿄쿄

배틀리뷰님의 댓글

배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 댓글의 댓글 작성일
profile image

유튜브 동영상 화질이 기본적으로 저해상도로 보이길래 기본 화질을 720p로 올리니 익스플로러에서는 초기화면이 깨져보이네요. 흑흑...
유튜브 영상은 다시 복구시켜놓았습니다~! 화질이 좋지 않으면 720p 이상으로 올려서 감상하시면 좋아집니다. (당연당연;;) ^^

으컁컁님의 댓글

으컁컁 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

AMD는 다이렉트x12이 성능이 더 좋게나오고 geforce는 다이렉트x11이 성능이 더 잘나오는군요.
재미있는 현상입니다.
아무래도 차기 그래픽카드는 AMD로 가는게 좋으려나요ㅋ

켄츠할배님의 댓글

켄츠할배 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 댓글의 댓글 작성일
profile image

그건 터무니없는 소리죠.
엔당도 볼타부터는 DX12 본격지원 시작할거고, 암드가 GCN 탈피하는 순간 현 암드붕가도 버려집니다 ㅎㅎ

으컁컁님의 댓글

으컁컁 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 댓글의 댓글 작성일
profile image

확실한건 터무니 없는 소리가 될지 아닐지는 차기 그래픽카드가 나와봐야 알겠죠? ㅎㅎ
전 지포스를 주로 이용하는 유저로서 AMD와 치열한 가격경쟁을 해주길 바랄뿐입니다ㅎ
그리고 볼타는 파스칼 다음이 아닌가요? 次期(차기)는 볼타가 아니라 파스칼이지요.

빌기사야님의 댓글

빌기사야 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

다이렉트12로 인해서 암드가 더 힘을 내는군요  ㅎ 멀티어댑터 기술은 글카가 몇개까지 지원되는지 궁금합니다 3웨이나 4웨이 조합도  안정적으로 되면 좋은텐데  말입니다  좋은 리뷰 감사합시다ㅎ

디디콩님의 댓글

디디콩 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

멀티 어댑터 기술 이용해서 amd 주력으로 쓰면서 nvidia 피직스 기술 같은 nvidia 독점 기술을 사용할 수 있을까요?

스펠님의 댓글

스펠 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

아무래도  다렉12시장을 준비하고 개발 했지만  게임사들도  다렉11 을  선호했기  때문에  다렉 11사용하는 세월이  솔직히  너무 길었지요
이제야 빛을  보는군요  너무  앞서가긴 했지요 그럼에도  성능이  비슷했으니  ㅎㅎ 기본이 탄탄한 거지요

배틀천칭님의 댓글

배틀천칭 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

다렉12를 정식 지원하는 최근 출시작들에선 390이 980을 제법 여유롭게 따돌리네요.
390 유저로서 기분 좋은 그래프 입니다,. ㅋㅋㅋ

로얄고구마님의 댓글

로얄고구마 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
no profile image

암드에서도 결국 다렉 12에 효율을 보이는건 390이상 라인 유저들이네요. 애매한 380 유저들은 거기서 거디인거 같아 아쉽네요

배틀리뷰님의 댓글

배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 댓글의 댓글 작성일
profile image

풀HD 기준으로는 380까지 그럭저럭 성능향상이 있는 편입니다. 390 라인업이 아무래도 VRAM이 8GB나 되다보니 전반적인 증가폭이 높은건 사실이긴 합니다만...ㅠ

블러디루나님의 댓글

블러디루나 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

전체적인 내용을 보면, 확실히 Aots가 AMD쪽에 더 잘 최적화가 되어있는게 아닌가 싶기도 합니다. DX11에서도 충분히 좋은 성능을 보여주고 있으니까요~^^
그나저나 파스칼에서도 엔비디아가 같은 행보를 이어갈 것으로 예상되는 현상을 보이긴 하지만, 아마도 DP유닛을 추가적으로 구성하고 DX12에 대해서 대비하고 나올 확률이 커 보입니다.

sadrain님의 댓글

sadrain 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일
profile image

요즘 화두가 되고 있는 그 겜이군요...
게임만 좀 더 완성도 있게 나왔더라면 그 파급력은 정말 엄청날건대..

댓글을 다시려면 로그인이 필요합니다. 로그인 하러가기

배틀리뷰 목록

Total 8건 1 페이지
제목 글쓴이 날짜 조회
배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2016-10-20
20:34:46
6089
배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2016-06-28
13:23:18
26469
부타네코 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2016-04-20
00:30:36
4881
배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2016-03-31
00:03:49
3018
배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2016-03-21
19:20:21
1905
부타네코 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2016-02-20
16:38:41
7334
부타네코 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2016-02-12
14:23:07
4194
배틀리뷰 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 2015-12-05
02:33:16
2255
게시물 검색
제목

접속자집계
오늘
2,221
어제
9,563
최대
24,782
전체
6,451,641
사이트소개 개인정보취급방침 서비스이용약관 문의 & 제휴 메뉴 및 포인트 Update 하배 인스타그램
Copyright © www.hwbattle.com All rights reserved.
상단으로
모바일 버전으로 보기