Целью обзора является определение оптимального процессора для совместной работы с видеокартой Radeon R7 260X 2048 Мбайт.
В перечень испытуемых ЦП вошли:
Материал является неотъемлемой частью проекта «База результатов тестов игровых конфигураций». Из нее производилась выборка данных, необходимых для данной работы. Прошу наших читателей принять во внимание тот факт, что была проделана огромная и кропотливая работа, поэтому стоит уважать нелегкий труд автора.
Данное направление статей носит справочный характер, комментарии отсутствуют, поскольку каждый читатель сможет самостоятельно почерпнуть нужную ему информацию.
Тесты проводились на следующем стенде:
Процессоры:
Программное обеспечение:
Для более наглядного сравнения процессоров все игры, используемые в качестве тестовых приложений, запускались в разрешении 1920х1080.
В качестве средств измерения быстродействия применялись встроенные бенчмарки, утилиты FRAPS 3.5.9 Build 15586 и AutoHotkey v1.0.48.05. Список игровых приложений:
Во всех играх замерялись минимальные
и средние
значения FPS. В тестах, в которых отсутствовала возможность замера минимального FPS
, это значение измерялось утилитой FRAPS. VSync
при проведении тестов был отключен.
Процессоры разгонялись следующим образом. Стабильность разгона проверялась утилитой ОССТ 3.1.0 «Perestroika» путем получасового прогона ЦП на максимальной матрице с принудительной 100% нагрузкой. Соглашусь с тем, что разгон тестируемых CPU не является абсолютно стабильным, но для любой современной игры он подходит на все сто.
При максимальном разгоне у всех процессоров AMD частота контроллера памяти была поднята до 2400-2800 МГц.
Core i7-4770К
Штатный режим. Тактовая частота 3500 МГц, базовая частота 100 МГц (100х35), частота DDR3 – 1600 МГц (100х16), напряжение питания 1.08 В, напряжение питания DDR3 – 1.5 В, Turbo Boost – включен, Hyper Threading – включен.
Процессор удалось разогнать до частоты 4500 МГц. Для этого множитель был поднят до 45 (100х45), частота DDR3 – 2133 МГц (100х21.33), напряжение питания – до 1.25 В, напряжение питания DDR3 – 1.5 В, Turbo Boost – выключен, Hyper Threading – выключен.
Core i5-4670К
Штатный режим. Тактовая частота 3400 МГц, базовая частота 100 МГц (100х34), частота DDR3 – 1600 МГц (100х16), напряжение питания 1.07 В, напряжение питания DDR3 – 1.5 В, Turbo Boost – включен.
Процессор удалось разогнать до частоты 4500 МГц. Для этого множитель был поднят до 45 (100х45), частота DDR3 – 2133 МГц (100х21.33), напряжение питания – до 1.25 В, напряжение питания DDR3 – 1.5 В, Turbo Boost – выключен.
Core i5-4570
Штатный режим. Тактовая частота 3200 МГц, базовая частота 100 МГц (100х32), частота DDR3 – 1600 МГц (100х16), напряжение питания 1.07 В, напряжение питания DDR3 – 1.5 В, Turbo Boost – включен.
Core i5-4440
Штатный режим. Тактовая частота 3100 МГц, базовая частота 100 МГц (100х31), частота DDR3 – 1600 МГц (100х16), напряжение питания 1.06 В, напряжение питания DDR3 – 1.5 В, Turbo Boost – включен.
Core i5-4430
Штатный режим. Тактовая частота 3000 МГц, базовая частота 100 МГц (100х30), частота DDR3 – 1600 МГц (100х16), напряжение питания 1.06 В, напряжение питания DDR3 – 1.5 В, Turbo Boost – включен.
Core i3-4340
Штатный режим. Тактовая частота 3600 МГц, базовая частота 100 МГц (100х36), частота DDR3 – 1600 МГц (100х16), напряжение питания 1.05 В, напряжение питания DDR3 – 1.5 В, Hyper Threading – включен.
Core i3-4130
Штатный режим. Тактовая частота 3400 МГц, базовая частота 100 МГц (100х34), частота DDR3 – 1600 МГц (100х16), напряжение питания 1.04 В, напряжение питания DDR3 – 1.5 В, Hyper Threading – включен.
FX-8350 BE
Штатный режим. Тактовая частота 4000 МГц, частота системной шины 200 МГц (200х20), частота DDR3 – 1866 МГц (200х9.33), напряжение питания ядра 1.28 В, напряжение питания DDR3 – 1.5 В, Turbo Core и APM – включены.
Процессор удалось разогнать до частоты 4700 МГц. Для этого множитель процессора был поднят до значения 23.5 (200х23.5), напряжение питания ядра – до 1.54 В, напряжение питания DDR3 – 1.5 В. Частота DDR3 составила 2133 МГц (200х10.67), Turbo Core и APM – выключены.
FX-6350 BE
Штатный режим. Тактовая частота 3900 МГц, частота системной шины 200 МГц (200х19.5), частота DDR3 – 1866 МГц (200х9.33), напряжение питания ядра 1.28 В, напряжение питания DDR3 – 1.5 В, Turbo Core и APM – включены.
Процессор удалось разогнать до частоты 4700 МГц. Для этого множитель процессора был поднят до значения 23.5 (200х23.5), напряжение питания ядра – до 1.53 В, напряжение питания DDR3 – 1.5 В. Частота DDR3 составила 2133 МГц (200х10.67), Turbo Core и APM – выключены.
FX-4350 BE
Штатный режим. Тактовая частота 4200 МГц, частота системной шины 200 МГц (200х21), частота DDR3 – 1866 МГц (200х9.33), напряжение питания ядра 1.33 В, напряжение питания DDR3 – 1.5 В, Turbo Core и APM – включены.
Процессор удалось разогнать до частоты 4700 МГц. Для этого множитель процессора был поднят до значения 23.5 (200х23.5), напряжение питания ядра – до 1.52 В, напряжение питания DDR3 – 1.5 В. Частота DDR3 составила 2133 МГц (200х10.67), Turbo Core и APM – выключены.
A10-6800K
Штатный режим. Тактовая частота 4100 МГц, частота системной шины 100 МГц (100х41), частота DDR3 – 2133 МГц, напряжение питания ядра 1.31 В, напряжение питания DDR3 – 1.5 В, Turbo Core и APM – включены.
A8-6600K
Штатный режим. Тактовая частота 3900 МГц, частота системной шины 100 МГц (100х39), частота DDR3 – 1866 МГц, напряжение питания ядра 1.3 В, напряжение питания DDR3 – 1.5 В, Turbo Core и APM – включены.
Процессор удалось разогнать до частоты 4700 МГц. Для этого множитель процессора был поднят до значения 47 (100х47), напряжение питания ядра – до 1.5 В, напряжение питания DDR3 – 1.5 В. Частота DDR3 составила 2133 МГц, Turbo Core и APM – выключены.
A10-5800K
Штатный режим. Тактовая частота 3800 МГц, частота системной шины 100 МГц (100х38), частота DDR3 – 1866 МГц, напряжение питания ядра 1.32 В, напряжение питания DDR3 – 1.5 В, Turbo Core и APM – включены.
A8-5600K
Штатный режим. Тактовая частота 3600 МГц, частота системной шины 100 МГц (100х36), частота DDR3 – 1866 МГц, напряжение питания ядра 1.31 В, напряжение питания DDR3 – 1.5 В, Turbo Core и APM – включены.
Процессор удалось разогнать до частоты 4400 МГц. Для этого множитель процессора был поднят до значения 44 (100х44), напряжение питания ядра – до 1.45 В, напряжение питания DDR3 – 1.5 В. Частота DDR3 составила 2133 МГц, Turbo Core и APM – выключены.
Athlon X4 760K
Штатный режим. Тактовая частота 3800 МГц, частота системной шины 100 МГц (100х38), частота DDR3 – 1866 МГц, напряжение питания ядра 1.31 В, напряжение питания DDR3 – 1.5 В, Turbo Core и APM – включены.
Процессор удалось разогнать до частоты 4500 МГц. Для этого множитель процессора был поднят до значения 45 (100х45), напряжение питания ядра – до 1.45 В, напряжение питания DDR3 – 1.5 В. Частота DDR3 составила 2133 МГц, Turbo Core и APM – выключены.
Athlon II X4 740
Штатный режим. Тактовая частота 3200 МГц, частота системной шины 100 МГц (100х32), частота DDR3 – 1866 МГц, напряжение питания ядра 1.29 В, напряжение питания DDR3 – 1.5 В, Turbo Core и APM – включены.
Процессор удалось разогнать до частоты 4100 МГц. Для этого частота шины была поднята до 114 МГц (114х36), напряжение питания ядра – до 1.42 В, напряжение питания DDR3 – 1.5 В. Частота DDR3 составила 2127 МГц, Turbo Core – включен и APM – выключен.
Перейдем непосредственно к тестам.
Благодаря новому драйверу Catalyst графическое ядро APU "Kaveri" может работать вместе с дискретной видеокартой Radeon в режиме Dual Graphics. По сути, он представляет собой асимметричный режим CrossFire, который позволяет двум разным видеокартам семейства Radeon R7 "Volcanic Islands" работать вместе. В частности, AMD указывает возможность совместной работы с видеокартами Radeon R7 240 и Radeon R7 250. Также следует учитывать, что технология Dual Graphics не работает под DirectX 9 и поддерживает только полноэкранный режим. Если игра будет выводиться в окне, то Dual Graphics работать не будет. Технология Dual Graphics работает в режиме AFR (Alternate Frame Rendering), когда графические процессоры по очереди рассчитывают кадры.
APU | Рекомендованная видеокарта | Также работает с |
A10-7000-Series | AMD Radeon R7 250 DDR3 "Oland XT" | AMD Radeon R7 "Oland" |
A10-6000-Series | AMD Radeon HD 6670 "Turks XT" |
AMD Radeon HD 6450 "Caicos" |
A8-7000-Series | AMD Radeon R7 240 DDR3 "Oland Pro" | AMD Radeon R7 "Oland" |
A8-6000-Series | AMD Radeon HD 6450 "Caicos" AMD Radeon HD 6570 "Turks Pro" |
AMD Radeon HD 6670 "Turks XT" |
A6-7000-Series | AMD Radeon R7 240 DDR3 "Oland" | AMD Radeon R7 "Oland" |
A6-6000-Series | AMD Radeon HD 6450 "Caicos" | AMD Radeon HD 6570 "Turks Pro" |
A4-7000-Series | Н/Д | Н/Д |
A4-6000-Series | Н/Д | Н/Д |
"Старшую" модель Radeon R7 250 из двух видеокарт можно приобрести от 2,8 тыс. рублей в России или 75 евро в Европе , она оснащается 384 потоковыми процессорами, что даже меньше встроенного iGPU "Kaveri" - там используется 512 потоковых процессоров. Но и тактовые частоты существенно выше. В случае APU частота графического ядра составляет 720 МГц, у Radeon R7 250 она заявлена до 1.050 МГц. Также и видеопамять подключается к GPU отдельно, а не забирается из оперативной памяти - в зависимости от типа памяти она работает на частоте до 1.150 МГц. Интерфейс памяти в обоих случаях 128-битный. Видеокарта Radeon R7 250 может оснащаться 2048 Мбайт менее скоростной памяти DDR3 или 1024 Мбайт быстрой памяти GDDR5.
Видеокарта Radeon R7 240 тоже может работать совместно с новыми APU "Kaveri", причём обойдётся она дешевле - от 2,4 тыс. рублей в России или около 60 евро в Европе . Число потоковых процессоров уменьшено до 320, тактовая частота GPU 780 МГц тоже меньше, хотя всё равно чуть выше, чем у интегрированного графического ядра AMD A10-7850K. Различий по подсистеме памяти нет. Здесь тоже возможны конфигурации с памятью DDR3 или GDDR5. Тактовые частоты памяти составляют 900-1125 МГц. Обе видеокарты базируются на новом GPU "Oland", который выпускается по 28-нм техпроцессу, максимальное энергопотребление (TDP) составляет 65 или 30 Вт.
Для APU A10-7850K AMD рекомендует использовать видеокарту Radeon R7 250, чтобы получить максимальный прирост производительности. Для "младшего" A8-7600 предлагается уже Radeon R7 240. В обоих случаях AMD рекомендует выбирать менее скоростные, но обычно и менее дешёвые видеокарты с памятью DDR3. Технология Dual Graphics будет работать и с видеокартами GDDR5 в системах "Kaveri", но у версий DDR3 будет наблюдаться меньше проблем по выравниванию кадров, будет упрощена синхронизация между интегрированной и дискретной видеокартами.
Dual Graphics обещает плавную игру в современные игры в разрешении Full-HD с высокими настройками качества. По крайней мере, так утверждает AMD. В результате вы сможете собрать игровую конфигурацию с минимальным бюджетом (дешевле 20 тыс. рублей). Базовая конфигурация на A10-7700K и Radeon R7 240 обойдётся около 14 тыс. рублей, за конфигурацию с A10-7850K и Radeon R7 250 придётся отдать около 15-16 тыс. рублей.
Пример конфигурации | ||||
---|---|---|---|---|
AMD A10-7850K + R7 250 | Цена* | AMD A10-7700K + R7 240 | Цена* | |
Процессор: | AMD A10-7850K | от 6,3 тыс. рублей | AMD A10-7700K | от 5,5 тыс. рублей |
Материнская плата: | Gigabyte GA-F2A88XM-DS2 |
Производительность нового гибридного процессора A10-7850K сравнивалась со скоростью работы его прямого конкурента — Core i5-4440, интеловского предложения аналогичной стоимости, построенного на базе новейшего дизайна Haswell. Попутно по скорости работы флагманской модели Kaveri мы сравнивали и со старшей модификацией Richland, A10-6800K. Также в число результатов тестов добавлены показатели производительности рассмотренного нами ранее A8-7600: этот процессор по сравнению с A10-7850K имеет более низкую тактовую частоту и снабжён урезанным графическим ядром, построенным на базе 384 шейдерных процессоров.
В результате набор тестового оборудования приобрёл следующий вид:
Тестирование выполнялось в операционной системе Microsoft Windows 8.1 Enterprise x64 с использованием следующего комплекта драйверов:
В первую очередь мы тестируем процессоры в платформах с установленной производительной дискретной видеокартой. Такая конфигурация позволяет сравнивать x86-производительность различных архитектур и даёт информацию о том, насколько те или иные CPU подходят для работы в составе производительных систем, где внешние видеокарты верхнего ценового диапазона устанавливаются в обязательном порядке. В этом случае графическое ядро процессоров задействовать невозможно, и оно деактивируется.
Следует подчеркнуть, что в контексте изучения A10-7850K такое тестирование имеет прямой практический смысл. AMD отказалась от дальнейшего развития своих процессоров серии FX, поэтому роль CPU для систем с дискретной графикой постепенно перейдёт к Kaveri или к их последователям.
Futuremark PCMark 8 2.0
По традиции в первую очередь для измерения производительности мы пользуемся интегральным тестом PCMark 8 2.0, который моделирует различные варианты типовой нагрузки на систему. Рассматриваются три сценария: Home — обычное домашнее использование ПК, Creative — использование ПК для развлечений и для работы с мультимедийным контентом и Work — использование ПК для типичной офисной работы.
Если вы читали наш предыдущий материал о процессорах Kaveri, то приведённые результаты не станут для вас неожиданностью. Да, вычислительная производительность ядер Steamroller невысока, поэтому четырёхъядерный Kaveri сильно отстаёт от младшего четырёхъядерного Haswell. Это было вполне ожидаемо, поэтому гораздо более сильное удивление способен вызвать тот факт, что A10-7850K отстаёт не только от Haswell, но и от A10-6800K поколения Richland. Очевидно, микроархитектурных улучшений Steamroller категорически не хватает для того, чтобы скомпенсировать понизившуюся тактовую частоту этого процессора. В результате старая модель APU оказывается быстрее новой на 3-4 процента.
Забавно, что, оправдывая достаточно большую установленную на A10-7850K цену, сама AMD ссылается на высокие показатели этого процессора именно в PCMark 8. Дело в том, что AMD имеет в виду результаты со включённым OpenCL-ускорением, но в случае использования дискретной видеокарты им воспользоваться невозможно, что и приводит к той печальной картине, которая отображена на приведённых диаграммах.
Производительность в приложениях
В Adobe Photoshop CC проводится тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений с цифровой камеры.
В Autodesk 3ds max 2014 мы тестируем скорость финального рендеринга. Измеряется время, затрачиваемое на рендеринг в разрешении 1920x1080 с применением рендерера mental ray одного кадра стандартной сцены Space_Flyby из тестового пакета SPEC.
В Мaxon Cinebench R15 проводится измерение быстродействия фотореалистичного трёхмерного рендеринга в анимационном пакете CINEMA 4D. Применяемая в бенчмарке сцена содержит порядка 2 тысяч объектов и состоит из 300 тысяч полигонов.
Тестирование скорости архивации измеряется в WinRAR 5.0. Здесь тестируется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 1,7 Гбайт. При этом используется максимальная степень компрессии.
Для тестирования скорости транскодирования видео в формат H.264/AVC мы пользуемся широко распространённым кодеком x264 версии r2358. Для оценки производительности используется исходный 1080p@50fps AVC-видеофайл из бенчмарка x246 FHD Benchmark 1.0.1, имеющий битрейт около 30 Мбит/с.
Отставание A10-7850K от похожего по стоимости Core i5-4440 составляет от 30 до 70 процентов. Иными словами, выбор процессоров семейства Kaveri для использования в составе систем с дискретной видеокартой смысла не имеет вообще. Даже более дешёвый A10-6800K, относящийся к прошлому поколению APU, зачастую способен предложить более высокую скалярную вычислительную производительность.
Производительность в играх
Тестирование в играх мы провели с использованием Full HD-разрешения и высоких настроек качества. Наша высокопроизводительная дискретная видеокарта GeForce GTX 780 Ti позволяет увидеть существенные различия в процессорной скорости даже в этом случае. Используемые настройки:
Полученные в игровых тестах результаты ещё раз подтверждают всё сказанное выше. Вычислительная производительность A10-7850K не лучше, чем у A10-6800K. Процессор поколения Richland, хоть и основывается на микроархитектуре Piledriver, а не Steamroller, имеет на 10 процентов более высокую тактовую частоту и более агрессивную технологию турбо. Этого вполне хватает, чтобы обеспечить большее количество кадров в секунду в играх при использовании дискретной видеокарты.
Поэтому нет ничего удивительного и в том, что A10-7850K не сравним по игровому быстродействию с Core i5-4440. Интеловский четырёхъядерник выдаёт куда более высокие показатели производительности в играх, так что для производительных геймерских систем платформа Socket FM2+ совершенно не подходит. Впрочем, это вряд ли стало для кого-то неожиданностью: с невысокой игровой производительностью процессоров AMD мы сталкиваемся каждый раз, когда речь заходит о носителях микроархитектуры Bulldozer или её последователей.
Steamroller против Piledriver
Полученные в вычислительных тестах результаты заставляют задаться вопросом, насколько же в действительности микроархитектура Steamroller прогрессивнее своей предшественницы. AMD утверждала, что рост производительности при постоянной тактовой частоте составит 15-20 процентов. Но практические результаты явно говорят о том, что внедрённые усовершенствования зачастую не компенсируют 10-процентное снижение тактовой частоты. Поэтому мы решили посмотреть, насколько Kaveri будет быстрее Richland, при условии их тактования на одинаковой частоте.
В следующей таблице приводятся результаты тестов, проведённых с процессорами A10-7850K и A10-6800K, частота которых была принудительно установлена на отметке 4,0 ГГц.
Kaveri 4,0 ГГц | Richland 4,0 ГГц | Преимущество Steamroller | |
---|---|---|---|
PCMark 8 2.0, Home | 2937 | 2873 | +2,2 % |
PCMark 8 2.0, Work | 2825 | 2796 | +1,0 % |
PCMark 8 2.0, Creative | 2990 | 2894 | +3,3 % |
WinRAR 5.0, секунды | 204,8 | 197,3 | -3,7 % |
Photoshop CC, секунды | 150,3 | 157,5 | +4,8 % |
3ds max 2014, секунды | 248 | 339 | +36,7 % |
x264 (r2358), fps | 15,1 | 12,92 | +16,9 % |
Cinebench R15 | 336,8 | 310,8 | +8,4 % |
Metro: Last Light, 1920x1080 SSAA HQ | 45,8 | 43,1 | +6,3 % |
Civilization V, 1920x1080 4xAA HQ | 56,3 | 53,7 | +4,8 % |
F1 2013, 1920x1080 4xAA UHQ | 72,5 | 75,8 | -4,4 % |
Batman: Arkham Origins, 1920x1080 4xAA UHQ | 75 | 71,1 | +5,5 % |
Соотношение между производительностью Steamroller и Piledriver оказывается очень неоднородным. В лучшем случае преимущество новой микроархитектуры превышает 35 процентов, а в худшем — она проигрывает до 4 процентов. Среднее же значение превосходства Kaveri над Richland в производительности на одинаковой тактовой частоте составляет около 7 процентов.
Характер полученных результатов позволяет сделать однозначный вывод, что в первую очередь превосходство Steamroller над Piledriver выявляется на многопоточных алгоритмах, задействующих целочисленные инструкции. Иными словами, выполненное в Steamroller разделение общего на двухъядерный модуль декодера инструкций вместе с другими оптимизациями позволило поднять эффективность работы целочисленных исполнительных устройств. Поэтому задачи вроде трёхмерного рендеринга или перекодирования видео получили очень заметный прирост в скорости выполнения. В том же случае, когда приложения активно используют всё ещё разделяемый блок операций с вещественными числами или SIMD-инструкции, прирост производительности оказывается заметно меньше.
Наблюдающееся же в отдельных случаях падение производительности, похоже, связано с ухудшением скоростных характеристик контроллера памяти, который у Kaveri создаёт бо льшую латентность при обращениях, чем у Richland.
Kaveri 4,0 ГГц |
Richland 4,0 ГГц |
Причины этого эффекта, вероятно, состоят в том, что контроллер памяти Kaveri на уровне архитектуры спроектирован универсальным и, помимо двух DDR3-каналов, имеет два дополнительных канала с поддержкой GDDR5-памяти. У имеющихся на данный момент моделей процессоров эта функциональность заблокирована, но её потенциальное наличие, как показывают тесты, несколько тормозит работу всей подсистемы памяти.
Игровая производительность
То, что традиционная вычислительная производительность A10-7850K не столь высока, как того хотелось бы, ещё ничего не значит. Просто не надо рассматривать этот процессор в качестве возможной основы системы, оснащённой дискретной видеокартой, — он для этого совершенно не годится. Его сильная сторона в другом: Kaveri может позволить обойтись вообще без какой-либо видеокарты. Встроенное в него графическое ядро семейства Radeon R7 нацеливается на то, чтобы предложить достойную для игровых систем производительность.
Говоря о возможностях встроенной в A10-7850K графики, AMD подчёркивает, что она быстрее, чем графические карты, установленные в 35 процентов игровых компьютеров (по данным Steam).
Благодаря этому данный гибридный процессор может обеспечить достаточно высокий уровень графической производительности (больше 30 кадров в секунду в Full HD-разрешении) не только в большинстве сетевых игр, но и в популярных однопользовательских играх.
Однако начать тестирование графической производительности видеоядра процессора A10-7850K мы решили с традиционного бенчмарка 3DMark Professional Edition 1.2. Результаты этого гибридного процессора сопоставлялись с показателями не только интегрированной графики A10-6800K, A8-7600 и Core i5-4440, но и дискретных видеоускорителей Radeon HD 7750 и Radeon R7 250.
Превосходство графического ядра A10-7850K над всеми остальными вариантами интегрированной графики очевидно. Благодаря новой архитектуре GCN 1.1 и увеличенному до 512 числу шейдерных процессоров рассматриваемый APU заметно превосходит по скорости как старший Richland, так и Haswell. Фактически A10-7850K на данный момент действительно предлагает самую производительную интегрированную графику для настольных компьютеров.
Однако, несмотря на это, A10-7850K всё-таки не дотягивает по своему результату до показателей графических карт Radeon HD 7750 и Radeon R7 250. Проблема встроенной в APU графики известна давно: недостаточно высокая пропускная способность подсистемы памяти ограничивает её производительность. Поэтому A10-7850K не только заметно отстаёт от Radeon HD 7750 с 512 шейдерными процессорами, но и проигрывает даже Radeon R7 250, у которого число шейдерных процессоров ограничено 384. Дискретные видеокарты оснащаются GDDR5 с пропускной способностью свыше 70 Гбайт/с, используемая же в платформе Socket FM2+ двухканальная память DDR3-2133 может предложить полосу пропускания лишь на уровне 34 Гбайт/с.
Впрочем, давайте посмотрим, что происходит в реальных играх.
В многопользовательском шутере Battlefield 4 интегрированная графика процессора A10-7850K, как и обещала AMD, оказывается способной обеспечить в Full HD-разрешении комфортное количество кадров в секунду даже при средних настройках качества. Превосходство над старшим Richland составляет 16-18 процентов, а над Haswell — достигает 70 процентов. Однако любителям поиграть при высоком качестве изображения всё-таки придётся снизить разрешение где-то до уровня 720p. К сожалению, графика A10-7850K не может предложить сравнимый с показателями Radeon HD 7750 и Radeon R7 250 уровень быстродействия: эти видеокарты быстрее на 35-40 процентов.
Популярный шутер Crysis 3 отличается высокими требованиями к производительности графического ускорителя, и здесь мы сталкиваемся с тем, что A10-7850K не может выдать приемлемую производительность в Full HD даже при минимальном качестве изображения. Очевидно, обладателям игровых систем на базе A10-7850K придётся в некоторых случаях разрешение снижать. Например, в том же Crysis 3 30 кадров в секунду при среднем качестве изображения можно получить лишь в разрешении 720p. Надо заметить, что видеокарты Radeon HD 7750 и Radeon R7 250 от такой проблемы избавлены.
Гоночный симулятор F1 2013 не отличается высокими требованиями к производительности графической подсистемы, поэтому, имея платформу на базе A10-7850K, в Full HD в него можно играть даже с высоким качеством изображения. Преимущество старшего Kaveri перед Richland здесь составляет 25-30 процентов.
Ещё одна требовательная к мощности графики игра, помимо Crysis 3, — это шутер Metro: Last Light. Обладая конфигурацией на базе A10-7850K без дискретного видеоускорителя, комфортно поиграть в него в Full HD-разрешении не удастся даже при минимальных настройках, а при среднем качестве разрешение придётся понижать до 720p. Стодолларовые дискретные видеокарты Radeon HD 7750 и Radeon R7 250 предлагают на 30-40 процентов более высокую производительность и неплохо справляются с отображением Metro: Last Light в недоступном для A10-7850K разрешении 1920x1080. Иными словами, говорить о Kaveri как о процессоре, встроенный графический движок которого способен обеспечить возможность установки Full HD-разрешения в любых играх, совершенно неправомерно.
В приключенческом боевике от третьего лица Tomb Raider производительность графической составляющей A10-7850K находится на неплохом уровне. В разрешении 1920x1080 возможна установка среднего качества изображения, при этом превосходство над Richland составляет 7-15 процентов. Графическое ядро GT2 процессора Haswell отстаёт от графики A10-7850K на внушительные 50-75 процентов, делая любые десктопные интеловские предложения плохим вариантом для использования в игровых системах, опирающихся на встроенные в CPU графические ядра.
Кстати, хочется обратить внимание на один любопытный момент: A10-7850K демонстрирует лишь слегка более высокое быстродействие, чем A8-7600, несмотря на то, что количество шейдерных процессоров в старшем APU на треть больше. Это — ещё одна иллюстрация к тому, что производительность интегрированных ядер AMD упёрлась совсем не в их графические ресурсы, а в пропускную способность памяти. Поэтому то, что Radeon HD 7750 и Radeon R7 250, оснащённые 128-битной GDDR5-памятью, выдают на 35-40 процентов более высокий FPS, удивлять не должно.
AMD отдельно напирает на то, что интегрированные системы, построенные на её процессорах, могут стать хорошим выбором для поклонников сетевых Free-to-play- игр. Наши тесты в многопользовательском боевом авиационном аркадном симуляторе War Thunder это всецело подтверждают. Обладатели конфигураций с процессором A10-7850K смогут комфортно играть в эту игру в Full HD-разрешении при выборе высокого качества изображения. Выгодно смотрятся тут и другие процессоры AMD. Интеловский же Haswell с графическим ядром GT2 подобный уровень производительности обеспечить не в состоянии.
В то же время самая популярная многопользовательская игра World of Tanks предъявляет к производительности графической подсистемы более высокие требования. Для получения комфортной частоты кадров в разрешении 1920x1080 обладателям A10-7850K в ней придётся снизить качество до среднего. И кстати, старший Kaveri тут не обеспечивает заметных преимуществ по сравнению с Richland — вероятно, причина кроется в высокой процессорозависимости данной игры. Впрочем, как бы то ни было, гибридный процессор A10-7850K — вполне достойный выбор для системы преданного поклонника танков. Однако дискретные графические карты с ценой порядка 100 долларов и здесь, как и в других случаях, позволяют получить на 30-35 процентов более высокую производительность.
То, что внешние видеокарты с аналогичной A10-7850K конфигурацией графического ядра обладают заметно более высоким быстродействием, а также то, что разница в практической скорости графики у A10-7850K и A8-7600 достигает лишь 5-10 процентов, явно указывает на главное узкое место в графической производительности — скорость подсистемы памяти. Совершенно очевидно, что для повышения производительности работы встроенной в Kaveri графики нужна более быстрая память. AMD планировала наделить Kaveri поддержкой более скоростных, чем DDR3, типов SDRAM, но что-то пошло не так, и финальные версии десктопных процессоров, хотя и перешли на новую платформу Socket FM2+, оказались совместимы лишь с традиционной DDR3 SDRAM.
Это значит, что нарастить скорость подсистемы памяти в Kaveri можно лишь использованием более скоростных модулей DDR3. Формально эти процессоры поддерживают модули с частотой до DDR3-2133, и именно с такой памятью мы и проводили тесты. Однако, как показала практика, в системы с A10-7850K можно устанавливать и DDR3-2400. О том, какой прирост производительности можно получить в этом случае, мы и поговорим ниже. А заодно посмотрим, насколько потеряет в своей скорости A10-7850K, если систему с ним комплектовать не DDR3-2133, а более медленными модулями.
Приведённые диаграммы вряд ли нуждаются в подробных комментариях. Они очень наглядно указывают на то, насколько важна для Kaveri быстрая память. Переход с DDR3-2133 на DDR3-2400 позволяет получить заметный прирост быстродействия — порядка 5 процентов. Если же в системе с A10-7850K использовать не DDR3-2133, а, например, ширпотребную DDR3-1600, то потери в игровом быстродействии будут доходить до 20 процентов. Иными словами, собирая недорогую геймерскую систему с A10-7850K, экономить на памяти явно не следует.
Как и графические карты поколения Volcanic Islands, процессоры Kaveri, основанные на той же архитектуре GCN, обладают поддержкой нового графического программного интерфейса Mantle. Это название давно будоражит умы обладателей новых видеокарт AMD, так как внедрение данного интерфейса обещает достаточно серьёзное увеличение производительности в играх. Аналогично дело обстоит и с Kaveri: внедрение Mantle может стать ещё одним способом более полного раскрытия потенциала встроенного графического ядра. Будучи хорошо осведомлённым об аппаратных тонкостях APU, Mantle предлагает специально оптимизированную прослойку между игровым движком и аппаратными ресурсами вычислительных и графических ядер. Подобный низкоуровневый программный интерфейс давно используется в игровых консолях, и там он показывает очень хорошие результаты. Поэтому широкое внедрение Mantle в современных играх способно поднять привлекательность Kaveri для экономных геймеров.
Для систем, построенных на базе процессоров Kaveri, Mantle не только реализует разнообразные низкоуровневые оптимизации, но и осуществляет более равномерное распределение нагрузки, создаваемой графическим драйвером, по x86-ядрам процессора. Однако следует иметь в виду, что в наибольшей степени Mantle эффективен тогда, когда игровая производительность упирается в скорость вычислительных ресурсов процессора, а в конфигурациях, использующих интегрированные видеоядра, ситуация обычно обратна: узким местом выступают мощности GPU и пропускная способность шины памяти. Тем не менее в момент представления Kaveri AMD говорила о возможном росте производительности, который можно получить за счёт фирменного API, — этот рост в реальных играх якобы достигает 45-процентной величины.
На данный момент у AMD уже готов бета-драйвер версии 14.1, поддерживающий Mantle, и существует игра — Battlefield 4, способная использовать этот программный интерфейс. Естественно, мы протестировали, как включение Mantle сказывается на частоте кадров в том случае, когда для запуска Battlefield 4 используется геймерская система с интегрированной графикой, построенная на базе процессора A10-7850K.
Никакими 45 процентами прироста тут и не пахнет. Увеличение количества кадров в секунду в Battlefield 4 в системе, основанной на A10-7850K, не превышает единиц процентов. Как известно, максимальный прирост активация Mantle даёт в системах со слабым процессором и мощной графической картой, а в случае с A10-7850K соотношение производительности вычислительных ядер и GPU — обратное.
В то же время от включения Mantle в системе на базе A10-7850K есть и заметный негативный эффект. Просто смотреть надо не на средний, а на минимальный FPS.
Минимальный FPS при задействовании Mantle по сравнению с DirectX заметно падает, то есть фирменный программный интерфейс AMD ухудшает плавность игры без каких-либо к тому предпосылок. Возможно, проблема кроется в том, что на данный момент драйвер Mantle находится в бета-стадии. Хочется верить, что AMD ещё внесёт в него какие-то изменения, которые смогут исправить низкий минимальный FPS и дополнительно поднимут скорость работы Battlefiled 4 через Mantle в системах, построенных на APU компании.
Каждый раз, когда дело касается тестирования встроенной процессорной графики, компания AMD предъявляет свой уникальный козырь — технологию Dual Graphics. Эта продвигаемая со времён Llano технология позволяет формировать ассиметричные CrossFire-конфигурации с участием встроенного в процессор графического ядра. Не обошла она стороной и Kaveri. Интегрированное видеоядро процессора A10-7850K, относящееся к серии Radeon R7, может быть «спарено» с любой дискретной видеокартой того же семейства Radeon R7, установленной в слот PCI Express. Ранее считалось, что на архитектуру таких видеокарт накладываются определённые ограничения, но на самом деле никаких рамок нет: вместе с A10-7850K в режиме Dual Graphics может работать любая графическая карта Radeon R7 с архитектурой GCN.
Причём с выпуском Kaveri и выходом драйвера Catalyst 14-й версии AMD наконец-то удалось решить давнюю проблему с тиарингом (разрывами кадров) выводимого изображения, которая напрямую затрагивала Dual Graphics-конфигурации. Теперь технология Dual Graphics работает значительно лучше и не вызывает никаких неприятных артефактов, поэтому её вполне можно рассматривать в качестве одного из путей увеличения графической производительности.
Для ознакомления с работой Dual Graphics в системе на базе Kaveri мы протестировали производительность комбинации A10-7850K и графической карты Radeon R7 250 с GDDR5-памятью.
Максимальный прирост быстродействия технология Dual Graphics обещает в том случае, если производительность процессорной графики и дискретной видеокарты примерно одинакова. Поэтому самой выгодной парой для A10-7850K AMD называет Radeon R7 240. Radeon R7 250 же дороже и быстрее, поэтому встроенная в процессор графика помогает ему не слишком сильно: увеличение производительности по сравнению с одиночной видеокартой составляет от 35 до 45 процентов.
При этом технология Dual Graphics так и не лишилась своих ограничений, которые во многих случаях ставят её полезность под вопрос. Как можно видеть по результатам, положительный эффект она даёт далеко не всегда. Существует огромное число игр, которые не только не получают прирост от Dual Graphics, но и, напротив, начинают выдавать меньшую частоту кадров. Связано это как с отсутствием необходимых оптимизаций драйвера, так и с тем, что в ряде случаев Dual Graphics вообще не включается на программном уровне. Например, эта технология может ускорять исключительно игры, работающие через DirectX 10/11, но не DirectX 9. Иными словами, масштабируемость, которую может предложить Dual Graphics, совершенно не впечатляет.
Наряду с игровыми приложениями графическое ядро процессоров Kaveri могут использовать для ускорения вычислений и обычные приложения общего назначения. Как уже говорилось, с выходом Kaveri компания AMD внедряет архитектуру HSA, делающую шейдерные кластеры графического ядра самостоятельными структурными единицами и упрощающую тем самым программирование и использование для вычислений параллельных шейдерных процессоров. Однако внедрение HSA и заточенного под эту архитектуру фреймворка OpenCL 2.0 — дело отдалённого будущего, пока же AMD даже не может предложить необходимого для включения данной технологии драйвера. Зато поддержка OpenCL 1.1 в Kaveri, как и в других разновидностях современных процессоров с интегрированной графикой, превосходно работает, и поддерживающие OpenCL приложения могут переносить часть своей вычислительной работы на шейдерные конвейеры через этот программный интерфейс.
База программных продуктов, способных задействовать гетерогенные возможности гибридных процессоров, неуклонно растёт и сегодня включает внушительное число популярных программ.
Предстоящее внедрение HSA должно расширить этот список, тем не менее стоит заметить, что ускорить за счёт использования параллельных процессоров графического ядра можно всё-таки не любые алгоритмы. В качестве применений, где использование гибридных возможностей APU может иметь практический смысл, AMD называет задачи распознавания образов, анализ биометрических параметров, системы дополненной реальности, задачи кодирования, редактирования и перекодирования аудио и видео, а также поиск и индексирование мультимедийных данных.
В идеале, мы бы не хотели прибегать к отдельным тестам производительности в задачах, использующих OpenCL. Было бы гораздо лучше, если бы поддержка гетерогенных процессоров появилась в общеупотребительных приложениях, в том числе и тех, которые мы используем для обычного тестирования. Однако такого пока нет: гибридные вычисления внедрены далеко не везде, причём в подавляющем числе случаев OpenCL-ускорение применяется лишь для реализации каких-то конкретных функций, и, чтобы его увидеть, необходимо придумывать специальные тесты. Поэтому исследование гетерогенной производительности и стало отдельной и независимой частью нашего материала.
Первым и наиболее известным тестом OpenCL-производительности выступает бенчмарк Luxmark 2.0, который построен на базе рендера LuxRender, использующего физическую модель распространения света. Для оценки гетерогенной производительности процессоров мы используем сцену средней сложности Sala, а её рендеринг выполняем с задействованием как графических, так и x86-ядер.
Как нетрудно заметить, подключение к работе вычислительных ресурсов графических ядер приводит к серьёзному увеличению производительности, но качественно меняет не слишком многое. Процессоры Intel, как и APU компании AMD, вполне способны предложить похожую функциональность: их современные модификации поддерживают OpenCL 1.1 полноценно и без каких-либо ограничений. Поэтому при использовании мощности графического ядра старший Kaveri сохраняет своё отставание от четырёхъядерного Haswell. Оно здесь не столь катастрофично, как в задачах, опирающихся лишь на x86-ядра, но тем не менее A10-7850K полноценным конкурентом для Core i5-4440 не выглядит.
Ещё один тест, активно задействующий ресурсы графических ядер, это SVPMark 3. Он измеряет производительность системы при работе с пакетом SmoothVideo Project, направленным на повышение плавности воспроизведения видео путём добавления в видеоряд новых кадров, которые содержат промежуточные положения объектов.
На диаграмме можно увидеть производительность процессоров как без задействования ресурсов их графических ядер, так и после включения GPU-ускорения. Достаточно любопытно, что заметное ускорение при этом получает не только Kaveri, но и Haswell. Так, задействование OpenCL поднимает производительность A10-7850K на 48 процентов, а Core i5-4440 ускоряется на 33 процента. Если же учесть, что Core i5 может предложить четыре x86-ядра с более высокой удельной производительностью, в конечном итоге гетерогенное быстродействие A10-7850K и Core i5-4440 устанавливается примерно на одинаковом уровне.
Одним из самых значительных достижений концепции APU, свидетельствующих о её принятии рынком программного обеспечения, стало появление поддержки OpenCL в популярном архиваторе WinZIP. Поэтому измерение скорости архивации в WinZIP 18 мы обойти стороной не могли. В целях тестирования сжатию подвергалась папка с распакованным дистрибутивом Adobe Photoshop CC.
WinZIP хорошо иллюстрирует тезис о том, что ускорению за счёт переноса нагрузки на графические ядра можно подвергнуть далеко не все алгоритмы. Хотя формально WinZIP имеет поддержку OpenCL, в реальности параллельные графические ядра подключаются к работе лишь при сжатии файлов объёмом более 8 Мбайт. Более того, особого выигрыша в скорости от этого нет, поэтому разница в производительности гибридных процессоров со включённым и отключённым OpenCL минимальна. Соответственно, более высокое быстродействие здесь во всех случаях показывает интеловский четырёхъядерный Haswell.
Формальная поддержка OpenCL появилась и в популярном графическом редакторе Adobe Photoshop CC. Правда, на самом деле гетерогенные возможности APU используются лишь в работе нескольких фильтров. В частности, AMD рекомендует измерять производительность при выполнении операции Smart Sharpen, что мы и проделали с 24-мегапиксельным изображением.
Прирост скорости работы фильтра Smart Sharpen, который можно получить при вовлечении в работу графической части современных процессоров, впечатляет. Данная операция начинает выполняться в системе с A10-7850K на 90 процентов быстрее, а в системе с Core i5-4440 — быстрее на 45 процентов. Иными словами, на примере фильтра Smart Sharpen мы можем увидеть хорошую вычислительную производительность графического ядра Kaveri, но она всё равно не позволяет A10-7850K опередить похожий по стоимости четырёхъядерный Haswell. И кстати, даже со включённым OpenCL-ускорением старший Richland превосходит A10-7850K за счёт более высокой тактовой частоты своих вычислительных и графических ядер.
Может быть перенесена на GPU и часть операций по транскодированию видео высокого разрешения. Для проверки того, какой прирост в скорости можно получить в этом случае, мы воспользовались поддерживающей OpenCL утилитой MediaCoder 0.8.28. Оценка производительности проводится с использованием исходного 1080p@50fps файла в AVC-формате из бенчмарка x246 FHD Benchmark 1.0.1, имеющего битрейт около 30 Мбит/с.
Здесь производительность Kaveri за счёт задействования для вычислений графического ядра удаётся увеличить совсем незначительно. Зато интеловский Core i5-4440, обладающий поддержкой специальной технологии для перекодирования видео Quick Sync, при включении вычислительных ресурсов графического ядра наращивает свою скорость в разы. На самом деле и в процессорах AMD есть похожая технология для аппаратного кодирования видеоконтента — VCE. Однако по какой-то причине ни одна из распространённых утилит для перекодирования видео этот движок не поддерживает. Будем надеяться, что с внедрением в Kaveri новой и более гибкой версии этого движка VCE 2 ситуация наконец сможет поменяться.
Ещё один пример популярного приложения, поддерживающего OpenCL, — это профессиональная программа для редактирования и монтажа видео Sony Vegas Pro 12. При выполнении в ней рендеринга видео нагрузка может распределяться по разнородным ресурсам гибридных процессоров.
Вовлечение в вычислительную работу графического ядра процессоров Kaveri позволяет получить очень весомый прирост в скорости рендеринга видео. Однако это всё равно не позволяет старшему APU компании AMD догнать конкурирующий Core i5-4440. Современные интеловские процессоры располагают гораздо более производительными x86-ядрами, поэтому даже при активации OpenCL A10-7850K серьёзно не дотягивает до скорости Haswell. Кроме того, интеловские процессоры тоже поддерживают OpenCL и ускоряются при подключении к вычислительной работе ресурсов графического ядра. Прирост скорости при этом не такой впечатляющий, как у APU компании AMD, тем не менее списывать его со счетов явно не стоит.
По просьбе AMD мы включили в эту часть тестирования и Futuremark PCMark 8 2.0. Данный бенчмарк при моделировании обычной пользовательской активности в общеупотребительных задачах может задействовать OpenCL-ускорение. И тогда мы можем получить представление о той производительности, которую будут показывать гибридные процессоры в идеальном случае, когда эффективную поддержку гетерогенных вычислений получат все распространённые приложения.
Понятно, почему AMD использует результаты PCMark 8 2.0 во всех своих маркетинговых материалах. Благодаря своему сильному графическому ядру A10-7850K побеждает во всех трёх сценариях: Home, Creative и Work. Это явно указывает на то, что при условии грамотной гетерогенной оптимизации приложений процессоры Kaveri могут оказаться гораздо лучше интеловских CPU. Иными словами, развиваемая AMD концепция APU действительно имеет большой потенциал, полноценно раскрыть который и должно помочь внедрение технологии HSA.
Энергопотребление — это ещё один традиционно больной вопрос для процессоров AMD. По крайней мере для их производительных модификаций, которые не имеют искусственно заниженных частот для удовлетворения требованиям экономичных тепловых пакетов. С выпуском процессоров Kaveri AMD рассчитывала немного поправить сложившуюся ситуацию и даже немного уменьшила расчётные показатели тепловыделения для старших моделей линейки A10. Помочь улучшению энергетических характеристик должен был не только новый 28-нм техпроцесс, но и снизившиеся тактовые частоты. Иными словами, удельная производительность в пересчёте на каждый затраченный ватт должна была возрасти.
Как же обстоит дело на практике? На следующих ниже диаграммах приводится полное потребление систем (без монитора), использующих встроенную процессорную графику, измеренное на выходе из розетки, в которую подключен блок питания тестовой платформы. Все имеющиеся в процессорах энергосберегающие технологии активированы. Нагрузка на процессорные ядра создаётся 64-битной версией утилиты LinX 0.6.5 с поддержкой набора инструкций AVX, а графические ядра нагружаются утилитой Furmark 1.12.
Потребление современных процессоров в состоянии простоя близко к нулю, так что показатели, приведённые на графике выше, касаются скорее платформ в целом, нежели исследуемых APU. Поэтому не удивительно, что, вне зависимости от того, какой процессор установлен в платформе Socket FM2+ , потребление получается примерно одинаковым. Система же на базе Haswell потребляет меньше — сказываются энергосберегающие технологии, которыми располагают современные наборы логики Intel.
При полной нагрузке на x86-ядра неожиданно выясняется, что A10-7850K стал даже более прожорливым, чем предыдущий флагман поколения Richland, A10-6800K. Потребление нового процессора выше на 9 Вт — даже несмотря на то, что его рабочие частоты заметно меньше. Соответственно, ни о каком соперничестве в экономичности с интеловскими четырёхъядерниками речь вести невозможно.
При графической нагрузке ситуация несколько отличается. Графическое ядро процессоров Kaveri обладает заметно лучшей экономичностью, чем графика Richland. Однако необходимо упомянуть один нюанс: Kaveri умеют динамически управлять частотой своего графического ядра, и при высокой нагрузке она автоматически снижается. По всей видимости, в данном случае мы как раз и столкнулись с пределом по потреблению, поскольку во время тестирования A10-7850K и A8-7600 частота их GPU периодически снижалась со штатных 720 МГц до 650 МГц, а временами — даже до 550 МГц.
Невысокое потребление демонстрируют Kaveri и при параллельной нагрузке на все ядра одновременно. Однако в данном тесте мы столкнулись с интеллектуальным управлением частотой не только GPU, но и вычислительных ядер. Как оказалось, при высокой графической нагрузке Kaveri не только сбрасывают частоту своего GPU, но и ограничивают частоту процессорных ядер 3-гигагерцовой величиной. В результате при одновременной высокой нагрузке на все ресурсы гибридного процессора его потребление оказывается не слишком большим, но это, естественно, сказывается и на производительности.
Старшая модель Kaveri, A10-7850K, формально относится к числу оверклокерских моделей, обладающих разблокированными множителями, — на это недвусмысленно указывает литера K в конце модельного номера. Но в данном случае это скорее дань традиции, нежели реальная сильная сторона новинок. Новый, применяемый для изготовления Kaveri, 28-нм SHP (Super High Performance) техпроцесс совершенно не способствует появлению у этих APU нераскрытого частотного потенциала. И даже с теоретических позиций новые гибридные процессоры должны гнаться ещё хуже, чем их предшественники, тоже не отличавшиеся хорошими возможностями разгона.
Это подтвердилось и на практике. Максимальной частотой, при которой A10-7850K, с одной стороны, сохранял стабильность, а с другой — не снижал свою скорость из-за превышения предельной температуры, оказалась 4,4 ГГц. Напряжение питания на процессоре при этом пришлось поднять до 1,375 В.
Следует подчеркнуть, что разгон A10-7850K — не такая уж и тривиальная процедура из-за интеллектуальных алгоритмов динамического управления частотой в зависимости от температурного режима и нагрузки. Увеличение процессорного множителя выше номинала на первый взгляд проходит очень легко и редко когда вызывает проблемы со стабильностью. Но при тестировании под нагрузкой нередко выясняется, что процессор для сохранения своей работоспособности самовольно сбрасывает частоту отдельных ядер существенно ниже заданных в BIOS материнской платы значений. К сожалению, эта интеллектуальность никак не отключается, поэтому при рассмотрении оверклокерских результатов, помимо всего прочего, требуется уделять отдельное внимание проверке реальных частот всех четырёх процессорных ядер. Такое самопроизвольное «торможение» процессора, к сожалению, не даёт возможности существенно поднимать его напряжение питания.
Попутно с традиционной процессорной частью можно разогнать и встроенное в APU графическое ядро. С увеличением напряжения на северном мосту процессора до 1,375 В, стабильности GPU нам удалось добиться при повышении его частоты в BIOS материнской платы до 960 МГц.
Впрочем, на самом деле, разгон графики в A10-7850K имеет мало практического смысла. Во-первых, отнюдь не частота ограничивает производительность GPU, а пропускная способность шины памяти. Во-вторых, при повышении частоты GPU вновь приходится сталкиваться со слишком интеллектуальным автономным управлением частотой. Увеличение частоты графического ядра приводит к тому, что в реальности при 3D-нагрузке она начинает систематически сбрасываться до более низких значений, и наблюдаемая на практике игровая производительность практически не возрастает.
Иными словами, AMD старалась сделать из Kaveri процессоры с предсказуемым энергопотреблением и тепловыделением, а это потребовало внедрения технологий управления реальной частотой, которые плохо уживаются с оверклокингом. Это значит, что Kaveri для экспериментов по разгону подходит неважно.
В целом Kaveri оказался очень неоднозначным продуктом, и мнения о нём могут кардинально различаться в зависимости от того, под каким углом смотреть на новинку. Об этом мы уже говорили, когда рассматривали модификацию A8-7600, это же должны повторить и сейчас, по итогам знакомства с A10-7850K.
Новый процессор безумно интересен тем, что он развивает концепцию гетерогенных вычислений и внедряет технологию HSA, которая позволяет разработчикам программных продуктов легко перейти к написанию алгоритмов, исполняющихся на вычислительных кластерах графического ядра. Кажется, ещё немного — и AMD добьётся того, что новые приложения будут работать на её процессорах не хуже, чем на CPU компании Intel. Для этого у Kaveri есть все необходимые ресурсы и, самое главное, огромная теоретическая вычислительная мощность, кроющаяся в графическом ядре.
Однако не всё так просто. Пока существует не так много даже простых оптимизированных под OpenCL приложений, а эффективность имеющихся реализаций гетерогенных вычислений оставляет желать лучшего. К тому же на параллельные вычислители графического ядра могут быть перенесены далеко не любые алгоритмы. В результате, подчёркивая, что в теории системы на базе Kaveri могут быть очень продуктивны, мы вынуждены констатировать реальное и заметное отставание рассмотренной нами старшей модели A10 от конкурирующего четырёхъядерного Core i5 в подавляющем большинстве счётных задач. Причём такая ситуация наблюдается сейчас не только в приложениях, исполняемых исключительно на x86-ядрах, но и там, где поддержка OpenCL уже реализована.
Другое дело — игры. Здесь у AMD всё совсем хорошо, даже несмотря на то, что скорость встроенного в A10-7850K GPU категорически упёрлась в пропускную способность шины памяти. Несмотря на это, конфигурации, построенные на этом процессоре и использующие возможности интегрированного графического ядра, с полным правом могут считаться полноценными игровыми системами начального уровня. Большинство современных игр может исполняться на A10-7850K в Full HD-разрешении, а многие из них, например популярные сетевые проекты, при этом вполне сносно работают даже с выбором среднего или высокого качества изображения. Десктопные Haswell подобную игровую производительность не могут предложить в принципе, по крайне мере до тех пор, пока Intel не решится перенести в настольные модели процессоров старшие модификации своих графических ядер GT3/GT3e.
В итоге на данный момент A10-7850K можно рекомендовать лишь как основу недорогих настольных компьютеров для нетребовательных игроков. Для энтузиастов же этот процессор малоинтересен — в первую очередь из-за своей ограниченной x86-производительности. Впрочем, если AMD умерит свои амбиции и снизит цены, противопоставив A10-7850K не четырёхъядерным, а двухъядерным процессорам конкурента, мы будем готовы пересмотреть свою позицию.
Сегодня мы поговорим про ряд видеокарт AMD Radeon R7 200 series. Речь пойдет о четырех представителях: 260, 250 и 240 сериях. Несмотря на то, что существует несколько отдельно взятых вариантов, разница между ними не настолько уж и велика. Все самые заметные отличия мы обязательно укажем и рассмотрим, чтобы вам не пришлось лишний раз задумываться о том, что покупать.
Начнем сразу с ценовой категории этих карточек. Несморя на то, что они все являются высокопроизводительными графическими процессорами и позволяют спокойно обрабатывать большие потоки данных, они находятся в так называемом эконом-секторе. В среднем вам придется отдать за такую карту до 10000 рублей, в зависимости от конкретной модели и магазина, что не может не радовать.
Хотя современные игры и создаются исключительно для самых новых видеокарт, а ультра-настройки работают только на видеопроцессорах от 50000 рублей, это не означает, что дешевые карты не смогут их заменить. Дело в том, что AMD Radeon R7 200 series отзывы от пользователей получают исключительно положительные, а значит, пользуются повышенным спросом.
Начнем мы с самых общих 200 series. Все они изготовлены по техпроцессу, определяющему размер кристалла 28 нм. Величина не слишком высокая, по сравнению с другими видеокартами, могла бы быть и лучше. В другом случае это привело бы к перегреву карты, однако два встроенных охлаждающих кулера сводят на нет данный конструкторский недочет AMD Radeon R7 200 series. Фото в статье это наглядно демонстрируют. Единственный недочет заключается в том, что вам придется чаще чистить систему охлаждения.
AMD Radeon R7 200 series, характеристики которых мы рассматриваем, подключаются через интерфейс PCI-E x16 версии 3.0. Вполне стандартно, но при этом намного лучше, чем AGP. При покупке просто обратите внимание на этот нюанс.
Что касается вывода информации на экран, то тут у AMD Radeon R7 200 series драйвер дает жару. Если в 240 серии видеокарта поддерживает всего два монитора, то во всех последующих появляется несколько возможностей.
При этом данные видеокарты поддерживают разрешение 4096х2160. Эти видеокарты подойдут как для обычных, так и для широкоформатных экранов. Таким образом, видеокарты способны поддерживать много-мониторные системы, а программное обеспечение, поставляемое вместе с ними, поможет пользователю с реализацией задуманного.
Давайте теперь поговорим о технической составляющей AMD Radeon R7 200 series. Характеристики данных видеокарт таковы, что они способны без особых усилий поддерживать работоспособность самых современных и требовательных игр. Исключением является AMD Radeon Но и выпущена она была достаточно давно.
Например, частота графического процессора, во многом определяющая производительность видеокарты, колеблется в районе 1 ГГц и может меняться в зависимости от производителя. В тоже время у 240 модели данная величина равна примерно 800 МГц.
Память видеокарты имеет форматы GDDR5 и DDR3. Но при этом если старые модели используют только устаревшую память, то новые (260 series) содержат исключительно современную технологию.
Также может существенно отличаться в пределах одной модели. Это также полностью зависит от производителя. Однако, несмотря на все старания, вы не сможете найти видеокарту AMD Radeon R7 200 series, характеристики которой содержат объем памяти выше 2 гигабайт. Но это и не нужно, если вас интересуют современные игры и требования к ним.
Исходя из формата памяти, также вытекает и пропускная способность AMD Radeon R7 200 series. Характеристики, которые мы получим на выходе, как нельзя лучше демонстрируют рабочие способности данных видеокарт:
Как видите, при многих прочих равных параметрах выигрывают только самые новые модели. Впрочем, при средней цене 7700 рублей покупка данной видеокарты для апгрейда своего ПК не составит большой проблемы.
Рассмотрев общие данные, доступные покупателю на ценнике в магазине, мы переходим к более точным цифрам. Характеристики AMD Radeon R7 200 series позволят нам точно сказать, какая из данных видеокарт лучше остальных.
Начнем мы с числа универсальных процессоров. С их помощью производится расчет цвета и формы объектов, выводящихся на экран. Как вы понимаете, от этого параметра сильно зависит быстродействие карточки в целом. И вот тут-то мы смело можем сказать, что 240 модель сильно отстает от своих собратьев по серии.
Безусловно, технические характеристики AMD Radeon R7 200 series очень важны. То, какие технологии способна поддерживать современная видеокарта, определяет её функциональность и полезность для пользователя.
Видеокарты рассмотренной серии уверенно себя чувствуют при работе с Direct X 12.0 и с Open CL 1.2. Кроме того, они прекрасно взаимодействуют с Open GL 4.3. А технология CrossFire давно перестала удивлять и также прекрасно поддерживается данными карточками. В чем же тогда различия?
Выход в свет нашей первой статьи по настольным процессорам семейства Broadwell кроме всего прочего вызвал и пару справедливых замечаний, касающихся тестирования графического ядра в игровых приложениях. Действительно: тесты-то есть, но для сравнения взят только GPU HD Graphics 4600, с которым и так все понятно. А вот как успехи нового «графического топа» Intel выглядят на фоне процессоров AMD или недорогих дискретных видеокарт - с практической точки зрения вопрос более важный. Тем более, что процессоры C-серии дороже аналогичных Haswell долларов этак на 100, а этого вполне достаточно для приобретения Radeon R7 250X или чего-то близкого, то есть не совсем уж медленного решения.
Вот сегодня мы все вопросы и снимем.
Процессор | Intel Core i5–4690K | Intel Core i5–5675C | Intel Core i7–4770K | Intel Core i7–5775C |
Название ядра | Haswell | Broadwell | Haswell | Broadwell |
Технология пр-ва | 22 нм | 14 нм | 22 нм | 14 нм |
Частота ядра, ГГц | 3,5/3,9 | 3,⅓,6 | 3,5/3,9 | 3,3/3,7 |
Кол-во ядер/потоков | 4/4 | 4/4 | 4/8 | 4/8 |
Кэш L1 (сумм.), I/D, КБ | 128/128 | 128/128 | 128/128 | 128/128 |
Кэш L2, КБ | 4×256 | 4×256 | 4×256 | 4×256 |
Кэш L3 (L4), МиБ | 6 | 4 (128) | 8 | 6 (128) |
Оперативная память | 2×DDR3–1600 | 2×DDR3–1600 | 2×DDR3–1600 | 2×DDR3–1600 |
TDP, Вт | 88 | 65 | 84 | 65 |
Графика | HDG 4600 | IPG 6200 | HDG 4600 | IPG 6200 |
Кол-во EU | 20 | 48 | 20 | 48 |
Частота std/max, МГц | 350/1200 | 300/1100 | 350/1250 | 300/1150 |
Цена | Н/Д (0) | Н/Д (0) | $432(70) | Н/Д (0) |
Процессоров Intel будет две пары - чтобы четко понять, где у Core i7 есть преференции перед Core i5, а где одна суета сует и томление духа . Сравнение будет идти в игровых приложениях, разумеется, и с дискретной видеокартой. Этот вопрос мы, впрочем, уже исследовали, но там i5 и i7 были разночастотными, а сегодня мы их по этому параметру уравняли. В принципе, можно было бы и Broadwell той же частоты взять, но он такой есть только в виде Xeon, т. е. не сказать чтоб массовое решение. Так что тут прямых пересечений не будет - просто обе сокетные модели бытового назначения.
Процессор | AMD A10–6800K | AMD A10–7850K |
Название ядра | Richland | Kaveri |
Технология пр-ва | 32 нм | 28 нм |
Частота ядра std/max, ГГц | 4,¼,4 | 3,7/4,0 |
Кол-во ядер (модулей)/потоков вычисления | 2/4 | 2/4 |
Кэш L1 (сумм.), I/D, КБ | 128/64 | 192/64 |
Кэш L2, КБ | 2×2048 | 2×2048 |
Кэш L3, МиБ | - | - |
Оперативная память | 2×DDR3–2133 | 2×DDR3–2133 |
TDP, Вт | 100 | 95 |
Графика | Radeon HD 8670D | Radeon R7 |
Кол-во ГП | 384 | 512 |
Частота std/max, МГц | 844 | 720 |
Цена | $132(48) | $143(46) |
Процессоров AMD мы решили взять два - чтоб не скучно было. К тому же тут тоже интересно оценить прогресс графики, и не стоит забывать о том, что и у A10–6800K есть брат-близнец в виде Athlon X4 760K. А какой из «Атлонов» выбрать при использовании дискретной видеокарты (760К или 860К) - вопрос интересный с практической точки зрения. Тем более, 760К заработает и на плате с «обычным» FM2. Может быть такое, что пользователя перестал удовлетворять какой-нибудь старенький A6–5400K, и он решил сменить процессор и добавить дискретную видеокарту? Вполне может. Вот и посмотрим, есть ли при таком раскладе смысл менять системную плату.
Что касается прочих условий тестирования, то они были равными, но не одинаковыми: частота работы оперативной памяти была максимальной поддерживаемой по спецификациям, а они немножко отличаются. А вот ее объем (8 ГБ) и системный накопитель (Toshiba THNSNH256GMCT емкостью 256 ГБ) были одинаковыми для всех испытуемых. Все тесты проводились и при использовании встроенного видеоядра (которое есть у всех шести процессоров), и совместно с дискретным Radeon R7 250X.
Поскольку нами уже было установлено, что на программы из набора iXBT Application Benchmark 2015 конкретная видеокарта влияет очень слабо, мы ограничились игровой методикой iXBT Game Benchmark 2015. Все результаты были получены в разрешении 1920×1080 (Full HD) при минимальных настройках качества и в 1366×768 при максимальных настройках. Почему такой выбор? Максимальные настройки при FHD-разрешении «не по зубам» не только интегрированным видеоадаптерам, но и многим недорогим дискретным решениям. Но повысить качество хочется многим - пусть даже ценой снижения разрешения. Тем более, что снижение не всегда такое уж радикальное - на руках у пользователей все еще встречаются и старые мониторы вплоть до поддерживающих максимум 1280×1024 точки. Поэтому почему бы и не проверить «низкие» режимы. К тому же, при настройках на максимальное качество удельная доля нагрузки на GPU увеличивается, а нам сегодня как раз интересны GPU. И пусть даже они не справятся с работой - получится стресс-тест, хорошо демонстрирующий собственно возможности графики.
Как видим, HD Graphics в Haswell с этой задачей не справляется, на обоих А10 уже поиграть можно, но на грани, а Broadwell с Iris Pro сомнений не оставляет. Но если говорить об использовании дискретной видеокарты, то тут все процессоры равны. Цена же Athlon X4 в разы ниже, чем у любого Core i7. Такое же положение дел будет и в других играх с невысокими требованиями к производительности процессора, но высокими - к графике.
Но WoT, впрочем, прямая противоположность сформулированному выше - здесь графика нужна постольку-поскольку. Лишь бы не мешала. HD Graphics 4600 очевидно мало. Остальных - достаточно настолько, что при добавлении дискретной видеокарты производительность не увеличивается, а может даже снизиться.
Еще одна процессорозависимая игра, которой достаточно и HDG 4600 для выбранного режима. Впрочем, более быстрая графика даже при слабой процессорной части позволяет добиться более высоких результатов. А дискретный видеоадаптер показывает, что кэш четвертого уровня в ряде случаев действительно делает Broadwell-С куда более быстрым решением, нежели Haswell. Практической пользы, впрочем, от этого немного - 200 или 300 кадров это уже неважно. Тут, очевидно, надо качество повышать, чем мы чуть позже и займемся.
Игра тяжелая для всех систем, но в первую очередь - видеокарты. Как видим, только интегрированная графика Broadwell, причем в старшей модификации (GT3e) вообще позволяет играть в таком режиме: Haswell GT2 традиционно отстает вдвое, а лучшие IGP AMD - в полтора раза. Однако при использовании недорогой дискретной видеокарты все внезапно становятся равными: и дешевые Athlon (а отключение графической части в А10 именно так преобразует процессоры), и дорогие Core i7.
В предыдущей версии Metro расклад подобный. Правда тут уже А10 подбираются к порогу играбельности, но без натяжек пригодны только Broadwell-С и им подобные. Дискретка (даже такая относительно слабая, как 250Х) от производительности процессоров зато уже зависит. Другой вопрос, что «атлонов» по-прежнему хватит, а десятью кадрами в секунду можно и пренебречь.
В очередной уже раз Hitman похож на Metro 2033 с небольшими вариациями. Например, здесь очень по-разному ведут себя два А10 разных поколений даже при использовании дискретки, т.е. оптимизации в Kaveri - не пустой звук. Однако как не оптимизируй, а Core i5 намного быстрее. Что же касается интегрированных решений, то тут снова без натяжек пригодны только Broadwell-С - на остальных придется снижать разрешение.
Очень тяжелая игра с которой не может справиться даже Iris Pro! Впрочем, как видим, здесь и 250Х хватает без особого запаса - в паре с медленными процессорами так и вовсе на пороге играбельности.
Как мы уже не раз говорили, в минимальном режиме Tomb Raider прекрасно работает на всем (или почти на всем). Впрочем, новые Broadwell тут все равно есть за что похвалить, поскольку не так уж сильно отстают от бюджетной, но дискретной видеокарты:)
В этой игре без дискретки никуда. Причем, что любопытно, Iris Pro 6200 как обычно вдвое быстрее, чем HDG 4600, но вот решения AMD обгоняет уже незначительно. Судя по всему, основная нагрузка на шейдерные и прочие блоки, а их при помощи eDRAM не ускоришь. Посмотрим - как это проявится при увеличении качества.
Новых А10 более-менее хватает, Broadwell-С достаточно без натяжки, Haswell тут ловить нечего (если не считать R-серию, также снабженную видеоядром GT3e). Но…, но дешевле будет поставить дискретную видеокарту.
Итак, что мы имеем в режиме минимального качества? Broadwell-С справляются почти со всеми играми нашего набора, кроме одной. Производительность Broadwell GT3e примерно вдвое выше, чем у Haswell GT2, да и интегрированную графику AMD эти решения обходят раза в полтора. Но лучше, конечно, при возможности использовать дискретную видеокарту - это даже дешевле может выйти. И всегда уж как минимум не медленнее.
Дискретная видеокарта играть позволяет даже при использовании недорогого процессора, интегрированная графика все еще непригодна. Никакая.
С большим трудом и напрягаясь Core i5–5675C выбрался за 30 FPS. Более дешевая связка из Athlon X4 760K или 860К и R7 250X не напрягаясь набирает почти 40. Комментарии излишни.
Вот здесь Iris Pro 6200 выглядит очень хорошо. Пусть дискретная видеокарта и чуть быстрее, но незначительно. Хуже то, что ее использование не всегда возможно, так что появление мощного интегрированного видео - большое благо для тех, кто находится в таких условиях.
Недостаточно и младших дискретных карт - значит об интегрированных решениях можно забыть на практике. С точки зрения теории же любопытно то, что здесь они достаточно близки друг к другу, что немудрено: когда основная нагрузка ложится на сам GPU, никакие ухищрения в плане работы памяти уже не помогают.
Все еще более выражено чем в предыдущем случае. Любопытно разве что то, что HDG 4600 быстрее, нежели Radeon HD 8670D. Однако практически значимым это не является.
Опять не справляется даже дискретная карта, а ее отрыв от интегрированных решений увеличивается до трех-пяти раз. При минимальном же качестве, напомним, было иногда и меньше двух. Т.е. чем выше требования к GPU, тем больше разница между интегрированными и дискретными вариантами последних. Что более чем ожидаемо, но не всеми учитывается.
При наличии дискретной видеокарты играть можно, а вот интегрированной совсем не хватает, причем любой. Аналогичная картина была и на минимальных настройках FHD, только тут она стала еще нагляднее. Но ничего удивительного - вообще для этой игры желательны карты уровня минимум Radeon R7 265 и выше. И таких игр не так уж мало.
Если при минимальных настройках эта игра очень щадяща к видеосистеме, то увеличение качества может «поставить на колени» и куда более мощные решения, чем нами сегодня рассматриваются. Т.е. пространство для маневра здесь огромное, но удачно им воспользоваться могут только владельцы дискретных видеокарт.
Аналогичным образом ведет себя и Sleeping Dogs, только вот преимущества дискретного решения еще более зримы. А вот бенефиции от eDRAM еще заметнее улетучиваются, поскольку до скорости текстурирования дело даже не доходит: пока еще слишком слабы сами графические процессоры. Но слабы по-разному, так что интегрированный Radeo R7 может даже обогнать Iris Pro. На практике, впрочем, это не имеет значения, поскольку оба все равно слишком медленные.
И еще один подобный случай подтверждает высказанную выше гипотезу:)
В общем и целом, как видим, попытки использования режимов с высоким качеством картинки (пусть даже со снижением разрешения) только лишь н
прочитано 54005 раз