Ideal Horizon

Blog Info

  • About
  • Chatroom
  • Weather · Calendar
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
AMD의 새로운 CPU 아키텍처 라이젠

2017. 3. 13. 03:20이야기들/컴퓨터·IT 이야기

라이젠 로고


AMD의 사운이 걸린 새로운 CPU, 라이젠


2017년 3월, AMD의 새로운 CPU 아키텍처인 라이젠의 첫번째 시리즈 서밋릿지가 출시되었습니다. AMD로선 불도저의 실패 이후 지금까지 인텔의 독무대나 다름 없었던 PC CPU 시장에 새로운 아키텍처를 들고 사운을 건 도전장을 던진 셈입니다. 


AMD의 입장에서 라이젠의 출시는 참으로 감회깊은 일이라고 할 수 있을 것입니다. 1GHz의 벽을 먼저 통과한 후 애슬론 프로세서로 인텔을 앞설 때만 해도 점유율 48%까지 쫓아갔건만, 결국 인텔의 불공정한 리베이트 공세와 컴파일러 차별로 대세를 바꾸지 못한 채 차기 제품에서 불도저라는 전략적 실수마저 저지르면서 역전당한 후로 10년 동안 제대로 경쟁도 하지 못한 채 압도적인 열세에 처해 있었기 때문이지요.


라이젠 프로세서는 기존에 AMD가 선택했던 모듈-코어 CMT 아키텍처에서 벗어나 보다 인텔과 비슷한 SMT 아키텍처로 변화하였습니다. 불도저와 그 후속모델들을 통해 처절하리만큼 CMT 구조가 현 컴퓨팅 환경에 맞지 않는다는 것이 증명된 이상 미련을 버렸다는 의미일 것입니다. 불도저에서 단추를 잘못 끼우기 시작한 탓에 AMD의 사세는 많이 기울었고 이제 그 악순환을 끊기 위해서라도 인텔과 어느 정도 닮은 형태로 재시작한 라이젠이 경쟁의 기반을 다시 마련해야 합니다.


물론 라이젠의 SMT가 인텔의 SMT, 즉 HT와 닮은 논리스레드 방식이라고는 해도, 그 본질적 구조는 많이 다릅니다. 외형적으로 보면, 라이젠의 내부 구조는 CCX라는 코어 및 그 보조요소들의 집합체로 이루어져 있습니다. CCX 하나에는 4코어가 상호연결되기 때문에 8코어 라이젠의 경우는 CCX 2개가 서로 연결된 형태가 됩니다. 즉, 하나의 CPU 다이 안에 2개의 프로세서 모듈이 서로 신호를 주고 받으며 정보를 처리하는 구조인 것입니다. 그리고 각 모듈 내부에 있는 코어들도 각각 2개의 스레드를 갖고 연산을 실행하게 됩니다.


반면에 인텔은 링버스라는 구조를 지니고 있어서, 하나의 링버스 집합체에 10~12개까지 코어 및 그 보조요소들이 상호연결됩니다. 때문에 같은 8코어라도 1개의 프로세서 집합으로 정보를 처리합니다. 이 단일집합체 내부에서 각각의 코어들이 2개의 스레드를 갖고 연산을 실행하게 되어 있는 것입니다. 결국 AMD의 SMT는 인텔의 HT를 그대로 본딴 아키텍처가 아니라, 불도저의 CMT 모듈 설계를 참고로 하면서도 인텔의 HT와 닮은 자신들만의 새로운 물리-논리스레드 방식을 구현하는 쪽으로 재개발한 형태라고 볼 수 있을 것입니다.


라이젠이 AMD만의 아키텍처라는 점은 캐싱기법을 보면 잘 알 수 있는데, 본래 내장 그래픽 용도로 쓰인 L4 같은 예외를 제외하면 모든 캐시에서 종합캐싱을 사용하는 인텔과 달리 AMD는 라이젠의 L3캐시에서 아직까지 불도저처럼 빅팀캐싱을 사용합니다. 빅팀캐싱은 종합캐싱에 비해 용량효율이 좋고 다이크기를 줄여 원가를 낮출 수 있지만 연속캐싱성능이 심각하게 떨어져 성능에 악영향을 끼칩니다. 그러나 AMD는 L3까지 완전히 빅팀캐싱을 포기하지 않았고 대신 센스미라는 프리페치용 제한적 학습 알고리즘을 적용하여 분기예측성능을 높임으로써 L3에서의 불리함을 극복하는데 성공하였다고 밝히고 있습니다.



센스미 소개


10여년만에 인텔을 위협하게 된 AMD


라이젠이 출시되기 직전과 직후, 각종 벤치마크를 통해 엄청난 가격대성능비로 인텔 하이엔드 데스크탑(이하 HEDT) 프로세서들을 위협할만한 상품가치를 지녔음이 증명되었습니다. 출시된 직후이기에 아직 소프트웨어들의 최적화가 거의 진행되지 않은 상태인데도 성능에서 엄청난 진전이 보여, 비록 인텔의 6~7세대 프로세서를 완전히 따라잡지는 못했어도 현재 인텔의 고급 CPU 라인인 브로드웰E와 종합적으로 엎치락 뒷치락 하는 모습을 보여주고 있기 때문입니다. 아직 근소하게 밀리는 부분은 있으나 최적화 여지나 가격, 전력대성능비, 시장 타겟팅을 고려할 때 사실상 브로드웰E와 동급 이상이라고 봐도 무방한 상황입니다.


그동안 시장에서 경쟁력을 지니지 못한 탓에 서드파티와의 연결고리가 괴멸되어, 특히 중요한 메인보드들이 출시직후부터 발목을 잡아 성능을 깎아먹는 요인이 되고 있고 램 호환성 등에서도 상당한 혼란을 겪는 등 아직 안정화가 진행되어야 할 것으로 보입니다만, 인텔의 6세대 프로세서인 스카이레이크도 출시 후 3개월 간 혼란스런 안정화 기간을 거쳤음을 생각할 때 사실상 사업을 처음부터 다시 시작하는 것과 다름없는 입장인 AMD로서는 많은 기회가 있다고 봐야 할 것입니다. 선행 출시된 8코어 라이젠 시리즈가 메인스트림이 아닌 플래그쉽 제품임을 감안하면 AMD 역시 이러한 상황을 고려해서 전략을 짜고 있음을 알 수 있습니다. 이미 더 이상 내려갈 브랜드 가치가 없는 상황이기에 오히려 모험적인 시행착오를 감수하고 있는 것입니다.


불도저의 실패로 인한 메인보드 제조사들의 AMD를 향한 불신 때문에 메인보드의 물량과 완성도가 부족한 상황 속에서도 라이젠 CPU의 판매량은 상당한 호조를 보이고 있는 것으로 알려져 있습니다. 이는 인텔과 비교할 수 없는 가격대성능비에서 기인하는데, 인텔이 고급 CPU 라인이라 치부하면서 판매하는 HEDT 라인과 동급 성능을 지녔으면서 가격은 3분의 1 이하이기 때문입니다. 그동안 인텔이 독점기업으로서 횡포를 부리고 있었던 탓에 반동이 왔다고도 해석할 수 있겠습니다. 더욱이 최근 몇 년간 CPU의 세대별 성능향상 정도가 체감할 수 없을 정도로 미비했기에 많은 소비자들에게는 라이젠의 가격대성능비가 더 잘 와닿는다는 점도 있습니다.


당연히 인텔로서는 큰 위협 요인이 아닐 수 없습니다. 2016년부터 14nm에서 10nm으로, 그리고 7nm으로 미세공정을 전환시켜야 하는 시기이기에 R&D 비용이 엄청나게 필요한 상황에서, 인텔은 전용 파운드리를 소유한 업체로서 미세공정 경쟁관계인 범용 파운드리 업체에 비해 불리한 입장에 처해 있습니다. 비록 미세공정 연구 자체는 앞섰으나, 그 연구를 계속 이어갈 비용을 마련하는데 있어서 자사 제품의 판매와 라이센스 이익에만 전적으로 기대야 하기 때문입니다. 요즘 들어 인텔이 사업다변화를 진행하고 CPU시장에서 최대한 고가정책을 유지한 이유 중 하나도 여기에 있습니다. 하지만 자사 제품만 만들어 파는 특성 때문에 결국 늘릴 수 있는 이윤에는 한계가 있을 수밖에 없습니다. 


AMD는 인텔과 경쟁관계에 있는 범용 파운드리 회사들에게 라이젠의 생산을 위탁하고 있습니다. 결과적으로 인텔은 AMD와 다른 범용 파운드리, 제각기 한 우물만 파는 각 업체들 양 쪽을 동시에 상대해야 합니다. AMD가 가성비로, 범용 파운드리 업체가 물량으로 시장을 확보해 인텔의 이익을 잠식하는 것만으로도 인텔의 차기제품 연구에는 큰 차질이 빚어지게 됩니다. 이미 10nm 미세공정이 계속 지연되고 있는 인텔로서는 가격인하를 무기로 삼기가 쉽지 않은데, 체감적인 성능차이를 AMD가 따라잡은 상황에서 고가 정책을 유지하는 것도 위험합니다. 라이젠의 6코어 및 4코어 메인스트림 라인이 출시되기 시작하면 이러한 딜레마는 더욱 심화될 것이고, 향후 인텔의 사업구조 자체를 뒤흔들 수 있는 문제로 발전할 가능성도 있습니다.



라이젠 시리즈


라이젠 출시 후 AMD에 남겨진 과제


라이젠은 분명 AMD가 재기를 꿈꾸며 만든 역작으로서 성능과 효율 양면에서 커다란 발전을 이루어 냈으며, 불도저의 오명을 벗기기에는 충분한 성취라고 평가할 만합니다. 그러나 새로운 도전에는 그만큼 리스크가 수반되는 법입니다. 라이젠 역시 그 개발목표에는 충분히 달했다고 할 수 있겠으나, 절대적인 관점에서 볼 때 아직 개량의 여지가 있습니다. 다시 말해서 AMD가 계속 연구개량이나 마케팅 노력에 매진하지 않으면 안 될 과제가 남아 있습니다.


출시 직후 라이젠은 종합성능에서 명백히 인텔의 브로드웰E를 따라잡은 모습입니다. 그러나 성능의 이면을 자세히 살펴보면 안정성에서 여전히 밀리는 점이 존재합니다. 특히 라이젠에 새로 도입된 논리 스레드 스케줄러 방식은 인텔의 것과 약간 다른 형식이기에 소프트웨어 쪽에서 인텔과 구분해서 최적화해주지 않으면 안정성도 약간 떨어질 수밖에 없습니다. 물론 네할렘 시절의 HT에 비할 문제는 아니라서 대부분의 경우 체감하기 어려우나 일부 프로그램에서 성능체감이 가능한 경우도 있으니 분명 소프트웨어 업계와의 협력 및 개량이 필요한 과제라 하겠습니다. 유감스럽게도 전통적으로 AMD는 이러한 분야를 다루는데 취약했고, 불도저 역시 소프트웨어 쪽에서 최적화가 거의 이루어지지 않아 안정성이 떨어지는 결과를 초래했습니다. 그나마 불도저에 비하면 라이젠의 안정성은 문제로 삼기도 어려운 것이나 마찬가지인 점이 위안입니다.


더불어서 하드웨어 업계의 지원도 인텔에 비하면 미약한 수준입니다. 라이젠 출시일 이후 대란이라고도 불릴만한 메인보드 수량의 부족 및 바이오스의 완성도 부족은 AMD가 얼마나 업계에서 힘이 없는지 느낄 수 있게 해주는 동시에 라이젠이 현재 AMD에 얼마나 중요한 전략제품인지 알 수 있게 해주는 대목입니다. 오버클럭을 제외하면 바이오스에서 가장 큰 말썽을 부리는 램 호환성 역시 이 문제와 직결됩니다. 라이젠은 불도저 이후 첫 제품이라는 입장이라도 있으니 소비자들이 일부 감안해줄 수는 있겠으나 반드시 이번 사태를 통해 협업체계를 재구축해야만 할 것이며, 만약 후속 제품에서도 같은 일이 일어난다면 AMD의 장래는 보장받기 힘들 것입니다. 더불어서 인텔이 벌여 온 리베이트 관행이나 그간 벌어진 브랜드 가치의 차이를 어떻게 극복하느냐 하는 마케팅 측면 역시 극복해야할 과제입니다. 


참고로 이 문제의 연장선에서, 라이젠의 4코어 CCX 구조에 관한 이슈 또한 언급할 수 있는데, CCX구조 자체는 인텔의 링버스와 비교해서 좀 더 생산자 친화적인 설계로 AMD가 새로운 제품이나 커스텀 사업을 구상하고 개발하는데 아주 편리한 형태입니다. 그러나 개별 CCX 내부에서의 통신속도와 서로 다른 CCX끼리의 통신 속도에 차이가 생기는 구조이기에, 비록 실제 일반 사용자 입장에서는 인텔 링버스와 평균속도 차이가 거의 없겠지만[각주:1], 역시나 CPU 소비자의 한 부류인 소프트웨어 개발자들 관점에서는 좀 더 신경을 써야하는 특성이 됩니다. 링버스 연결이 제 성능을 낼 수 없는 빅팀캐시가 포함된 구조에서 CCX 이외에 다른 효율적 대안이 없는 이상, 이 부분 역시 서드파티 업계를 비롯한 소프트웨어 개발자들과 AMD의 협력이 필요할 것입니다. 다만 다행스럽게도 현 시점에서는 이 구조 때문에 체감적인 성능저하가 일어나는 프로그램은 없어 보이며, 일반 사용자들 같은 엔드유저 입장에서 신경쓸 문제는 아니라고 판단됩니다.


당연하지만 라이젠 아키텍처 자체를 발전시키기 위한 노력도 앞으로 계속되어야 할 것입니다. 올코어 부스트 기능의 부족이나 R7 1700의 낮은 기본클럭 및 실망할 만한 R7 1800x의 오버클럭 여력 등은 아쉬운 점으로 남아 있습니다. 특히 커스텀 최적화와 더불어 우선적으로 고밀도 라이브러리의 한계 극복이나 인텔에 비해 약간 뒤떨어지는 GF의 미세공정을 진전시켜야 할 것으로 보이는데, 다행히 AMD나 GF에서는 차기제품에서 계속되는 성능향상을 공언하고 있고 설계도면이나 미세공정의 진척 정도를 볼 때 발전의 여력도 충분히 있어 보입니다. 인텔의 개발진척이 더딘 현 시장상황에서, 예정된 스케줄을 지키면서 꾸준한 발전을 거듭하여 후속제품을 내놓는다면 AMD에게 있어서 커다란 기회로 작용할 것입니다.



라이젠 확대사진


라이젠의 게임성능 관련 팁


라이젠의 전문작업 어플리케이션에 관한 성능은 소프트웨어들의 최적화가 거의 이루어지지 않았음에도 만족스런 성능을 보여줍니다. 물론 어플리케이션들도 제각기 적합한 CPU 특성에 따라 성능이 갈리기는 합니다만 범용성과 가성비를 종합할 때 라이젠은 모든 작업에서 충분한 가치를 보여주고 있으며, 각 소프트웨어 제작사의 최적화 진행에 따라 더욱 좋은 성능을 보여줄 것으로 기대됩니다.


한편 전문가가 아닌 일반 소비자들에게 있어서는 사실상 게임성능이 가장 중요한 성능의 척도가 될 터입니다. 객관적으로 여러 FHD 벤치마크 결과들을 보면, 클럭이나 IPC, 최적화 정도에 의한 절대적 게임성능은 인텔 6~7세대에 비해 약간 밀리는 면이 있으나 시스템 세팅을 적절히 맞춰준다면 근래의 게임에서 대부분 근소하거나 의미 없을 정도의 차이만을 보여주고 많은 코어 숫자에 의한 여유성능 확보에서는 더 유리하여, 라이젠 역시 좋은 게임성능을 보유하고 있다고 판단됩니다. 하지만 당혹스럽게도 국매 및 해외 벤치마크에서 성능측정환경에 따라 천차만별의 결과가 나오면서 논쟁거리의 불씨를 남겼다는 것 역시 부정할 수 없습니다. 현재 라이젠의 성능에 관련된 이슈들은 대부분이 게임성능에 관한 것들이라는 점에서 더욱 그렇습니다.


라이젠의 게임성능에 관해 현재 가장 큰 문제가 되고 있는 것은 크게 두 가지인데, 첫째가 GPU 로드율 저하 이슈이며 둘째는 SMT 관련 성능저하 이슈입니다. 이에 관해서 간단한 설명과 해결방법을 아래에 소개하고자 합니다.


우선 첫째 이슈는 게임성능 논란 중에서 가장 체감이 크고 치명적인 사항으로, 일부 게임[각주:2]에서 GPU 로드율이 비정상적으로 낮아지는 문제입니다. 본래 이 현상은, 게임엔진이나 그래픽 드라이버가 잘못된 것이 아닌 한에는, CPU 성능이 부족하여 CPU 점유율을 다 써도 GPU의 능력을 다 사용할 수 없을 때에나 발생하는 병목현상입니다. 허나 라이젠은 CPU 점유율이 남아도는데도 이 현상이 발생하여 단순한 병목문제가 아님을 알 수 있으며, 기이하게도 불도저에서도 똑같이 현상이 발생합니다. 현재까지 알려진 바로는, 근래 AMD 시스템에서 게임의 GPU 로드율이 비정상적으로 낮은 경우 우선 그래픽 카드에의 전원공급제한 기본설정이 너무 낮게 적용되는지 확인해보아야 한다는 것입니다. 따라서 위의 일부 게임이 라이젠 시스템에서 GPU 병목과 같은 성능저하 문제를 일으킬 때는 애프터버너 등의 유틸리티를 사용해 GPU 파워리미트 값을 맥스로 설정해 주어 문제가 해소되는지 확인할 필요가 있습니다. 또한 만일 이 방법으로 극복이 되지 않는다면 근본적인 해결은 어려우나 안티 얼라이어싱 등의 후처리를 최대한 적용해 GPU 로드율을 높이는 동시에 더 빠른 클럭의 램을 사용하여 시스템의 전체적 성능을 올림으로써 개선을 꾀해 볼 수는 있겠습니다. 원칙적으로는 게임의 최적화 등 정식 핫픽스가 등장해야 문제가 해결되겠지만 당장은 이 세팅방법들을 시도해 보는 것이 가장 빠릅니다.


다음으로, 둘째 이슈는 SMT, 즉 물리코어와 함께 논리스레드를 사용할 때 오히려 게임성능이 더 내려가는 경우가 있다는 문제입니다. 이 문제는 첫째 이슈보다 약간 더 많은 수의 게임에서 일어나는 현상으로 알려져 있는데 인텔 CPU에서도 같은 경향이 있는 것을 볼 때 논리스레드의 실행으로 인한 싱글스레드 성능 소비가 연관되어 있는 것으로 보입니다. 단, 인텔 코어 프로세서보다 라이젠에서 성능편차가 약간 더 나타나는 것으로 측정되는데 이는 라이젠의 스케줄러가 통합형이 아닌 분리형으로 설계되어 조금 더 복잡한 탓이 아닐까 추측됩니다. 이 역시 게임엔진에서 어느 정도 최적화가 가능할 것으로 보이나 CPU 아키텍처의 특성과 연관되어 있기도 하여 한계가 존재합니다. 그나마 이 문제에 의한 체감성능 차이는 역시나 일부 게임[각주:3]을 제외하면 그렇게 크지 않다고 여겨집니다. 게임제작사의 최적화 패치를 기다리는 것 이외에 사용자측에서 조치할 수 있는 방법은 SMT 기능을 끄는 것이지만, 위의 이슈와 달리 불편함이 수반되므로 추천하지 않습니다. 오히려 신경쓰지 않는 것이 나으리라 생각됩니다.


이외에 램 클럭에 관한 병목 이슈가 지적되곤 합니다만 이는 비단 라이젠만의 문제는 아니고 스카이레이크나 카비레이크에서도 마찬가지로 성능에 영향을 끼치는 요소로 알려져 있으며, 게임마다 다르긴 하지만 인텔 6~7세대든 AMD 라이젠이든 대개 2666~3200MHz면 거의 충분한 성능을 확보할 수 있는 것으로 여겨집니다. 일부에서 CCX 간 통신속도가 메모리 클럭의 절반인 것과 관련하여 병목 운운하는 설을 만들기도 하지만 위에서도 서술했듯 CCX 구조에서도 평균적인 통신속도는 인텔의 링버스 구조와 거의 비슷하니 개발자의 입장이 아닌 한에는 현재의 x86 환경에서 체감적으로 무시가능하며, 이 속도가 게이머에게까지 문제가 될 시기면 이미 링버스든 CCX 구조든 모두 더 빠른 형태로 진화해 있을 것입니다. 사실 이 문제가 부각되는 이유는 메인보드 바이오스의 미완성으로 호환되는 램이 적을 뿐더러 풀뱅크시 램 클럭이 크게 저하되는 버그 때문인데, 엉뚱하게 CCX 구조가 화풀이를 당하는 부조리한 측면이 있습니다. 지금으로서는 호환성이 확인된 램을 2개만 끼워 사용하는 방법이 사용자 입장에서의 최선이 되겠고, 하루 빨리 바이오스가 완성되도록 AMD가 시급히 노력할 필요가 있습니다.



라이젠 서밋릿지


최고의 제품은 아니지만 최고의 대체재


라이젠은 AMD가 불도저로 인한 실패 이후 다시금 인텔의 경쟁자로 설 수 있도록 해주는 첫 발판으로서 화려하게 시장에 등장했습니다. 타의 추종을 불허하는 최고의 성능을 지닌 제품은 분명 아니지만 여러 가지 성능적인 면과 가격대성능비, 전력대성능비를 종합할 때 이미 현 경쟁목표를 따라잡았다고 해도 과언이 아니며 반년 정도 후부터 출시될 인텔의 스카이레이크x에도 여전히 유효한 상업성을 지니고 대항할 것으로 예측됩니다. 더욱이 메인스트림 라인의 출시가 계속 예정되어 있고 아키텍처 설계 상으로 발전의 여지 또한 남아있는 등 후속 제품의 전망도 유망한 편입니다. 따라서 신형 아키텍처의 출시 직후 진통을 겪을 수 밖에 없는 메인보드나 램 등의 하위지원영역에서 안정화를 빠르고 무사하게 이루어낼 수만 한다면, AMD 라이젠 프로세서는 성능에 비해 가격이 비싸다는 평을 듣는 인텔의 주류 CPU에 대하여 명실공히 최고의 대체재로 등극할 수 있을 것입니다. 이는 10여년만에 PC용 CPU 시장에서 경쟁이 다시 시작된다는 의미이기도 하며 시장과 소비자들에게 보다 긍정적인 영향을 가져다 줄 것으로 기대됩니다. 


  1. 개별 CCX 내부의 통신속도는 링버스보다 빠르고, 서로 다른 CCX간의 통신속도는 링버스보다 느림. 이외에 다른 요소에서 미세하게 느리거나 빠른 차이가 존재하며 AMD의 공식입장에 따르면 종합적인 평균은 비슷함. [본문으로]
  2. AOTS, GTA5, 라이즈 오브 툼레이더, 메트로: 라스트 라이트, 오버워치 등. [본문으로]
  3. 배틀필드1 등. [본문으로]