Сайт о телевидении

Сайт о телевидении

» » Новая линейка мобильных процессоров Sandy Bridge

Новая линейка мобильных процессоров Sandy Bridge

Очередной обзор на тему нового продукта Intel, как правило, начинается с объяснения стратегии процессорного гиганта под названием Тик-Так. Смысл ее заключается в том, что каждые два года миру представляется новая архитектура с промежуточным переходом на более тонкий техпроцесс.


Благодаря ей, прогресс на рынке не останавливается и мы постоянно сталкиваемся с более функциональными и производительными решениями. Правда, некоторые нововведения не так сильно влияют на производительность, как того хотелось бы. Например, переход от архитектуры Core к Nehalem серьезной прибавки в скорости не принес, но позволил отказаться от привычной шины FSB и сделать ЦП более интегрированным, содержащим в себе не только контроллер памяти, но и графическое ядро. Последним оснащались очень медленные представители семейства Westmere. Следующий шаг Intel призван как раз исправить сложившуюся ситуацию и вывести будущие продукты на новый уровень производительности.

Семейство процессоров Intel, выполненных по 32-нм технологическим нормам (ядро Clarkdale) оказалось медленнее первых решений на базе архитектуры Nehalem (Bloomfield и Lynnfield). Исключением были шестиядерные Core i7-9xx (Gulftown), лишенные встроенного видеоядра. Такое поведение было обусловлено строением младших представителей Westmere, которые состояли из двух кристаллов. На одном из них располагались вычислительные блоки и кэш, а на другом — контроллеры памяти, шины PCI Express и графическое ядро. Связь между этими половинками осуществлялась за счет интерфейса QPI. Естественно, этот гибрид не смог демонстрировать чудес производительности, даже несмотря на поддержку технологии Hyper-Threading, благодаря которой он лишь конкурировал с младшими четырехъядерными моделями Core 2.

При такой высокой интеграции использование монолитного кристалла с внутренними широкими шинами для обмена информацией между блоками напрашивается само собой. Пройдя обкатку 32-нм техпроцесса, инженеры компании наконец-то смогли объединить все блоки в одном чипе и даже пересмотрели архитектуру, которая получила название Sandy Bridge.


Итак, что же в ней такого особенного? Во-первых, как уже отмечалось, все функциональные блоки теперь располагаются на одном кристалле, а количество ядер в производительных моделях процессоров увеличено до четырех. Во-вторых, разделяемая кэш-память третьего уровня стала общей для всех, включая видеоядро, и работает она на частоте процессора, что наилучшим образом скажется на производительности последнего. Кроме того, было увеличено быстродействие графического ядра, а часть северного моста, известная по старым процессорам как Uncore, теперь называется System Agent. И в-третьих, тактовый генератор встроен в чипсет и разгон по базовой частоте теперь потерял свою актуальность. Но обо всем по порядку.


Основные представители архитектуры Sandy Bridge содержат четыре ядра и поддерживают технологию Hyper-Threading, благодаря которой процессоры могут выполнять восемь потоков одновременно. Кэш-память третьего уровня (или LLC — last level cache, кэш последнего уровня) теперь работает на частоте процессора, имеет объем в восемь мегабайт и может использоваться всеми блоками ЦП, которые в нем нуждаются. Учитывая большое количество потребителей и возможный рост числа ядер в будущих процессорах, инженерам Intel пришлось отказаться от привычной топологии связи между узлами и отдать предпочтение 256-битной кольцевой шине, соединяющей вычислительные ядра, кэш, графический процессор и «системный агент». Пропускная способность такой шины за такт равна произведению количества процессорных ядер на ее ширину. Для четырехъядерного Sandy Bridge с 8 мегабайтами кэша и частотой 3,0 ГГц она составит 384 Гбайт в секунду (96 Гбайт/с на одно соединение), а для двухъядерного — лишь 192 Гбайт/с.


Объемы кэш-памяти остальных уровней остались без изменений (по 32 Кбайт для инструкций и данных, и 256 Кбайт второго уровня для каждого ядра), но скорость работы с ними теперь выше. Был еще добавлен так называемый L0-кэш на 1,5 тыс. декодированных микроопераций, позволяющий повысить быстродействие процессора и его энергоэффективность.

System Agent, пришедший на смену Uncore, является аналогом северного моста и содержит контроллеры памяти DDR3 и шин PCI Express, DMI, блок видеовыхода и модуль управления питанием (Power Control Unit, PCU). В отличие от того же Uncore, «системный агент» функционирует отдельно от L3-кэша и не зависит от его частоты и напряжения питания. Ранее связь с кэш-памятью третьего уровня накладывала сильные ограничения при разгоне процессоров, особенно на ядре Bloomfield. Двухканальный контроллер памяти был переработан и его производительность с латентностью теперь не хуже, чем у лучших представителей архитектуры Nehalem. Из поддерживаемой памяти заявлена DDR3-1066 и DDR3-1333, но при использовании материнских плат на чипсете Intel P67 Express можно будет устанавливать модули частотой до 2133 МГц. Количество линий PCI Express 2.0 по сравнению с предшественниками не изменилось и составляет 16 штук. При работе CrossFireX или SLI они могут комбинироваться по восемь линий для каждой видеокарты. «Системный агент», вычислительные ядра с кэшем и графический процессор трактуются отдельно друг от друга и имеют свои напряжения питания. Модуль PCU собирает данные по уровню энергопотребления и тепловыделения этих блоков и управляет их состоянием, переводя либо в экономичный режим работы, либо в производительный. Благодаря раздельной схеме тактования частот, ЦП и видеоядро за счет технологии Turbo Boost 2.0 могут разгоняться независимо друг от друга, и даже сверх нормы уровня TDP, но лишь на непродолжительное время и при условии, что процессор до этого простаивал некоторое время.


Помимо архитектурных изменений, в новых процессорах появилась поддержка 256-битных инструкций AVX (Advanced Vector Extensions), являющихся дальнейшим развитием SSE и позволяющих увеличить скорость вычислений с плавающей точкой в мультимедиа-приложениях, научных и финансовых задачах. Поддержка инструкций AES-NI, которые появились в Westmere и давали возможность повысить быстродействие шифрования и дешифрования по алгоритму AES, продолжила свое существование и в Sandy Bridge.

Новое графическое ядро Intel HD Graphics хоть и относится к новому поколению, но существенных архитектурных различий между ним и графическим процессором, встроенным в Clarkdale, нет. Это все те же 12 шейдерных блока (для HD Graphics 3000 и шесть для HD Graphics 2000), но уже с поддержкой DirectX 10.1 и OpenGL 3.0.


За счет переноса видеоядра на общий с процессором кристалл, выполненный по 32-нм технологическим нормам, стало возможным увеличивать тактовую частоту GPU до 1,35 ГГц. Это может положительно сказаться на быстродействии видеоподсистемы, вплоть до конкуренции с дискретными графическими адаптерами начального уровня AMD и NVIDIA. Но даже на такой частоте скорость в игровых приложениях все равно будет оставлять желать лучшего. В новой версии Intel HD Graphics скорее будет интересна возможность аппаратного кодирования видео формата MPEG2 и H.264, новые фильтры пост-обработки и поддержка HDMI 1.4 с Blu-Ray 3D.


Конечно, вышеперечисленные изменения призваны увеличить производительность новых решений, но самое серьезное нововведение в Sandy Bridge, пожалуй, будет перенесение генератора базовой частоты в набор системной логики. Он единственный и от него зависят все частоты различных узлов и блоков, как самого процессора, так и чипсета. По этой причине базовая частота составляет 100 МГц и при ее повышении будут расти частота не только процессора, но и всевозможных шин и контроллеров, а это серьезно скажется на стабильности системы во время разгона.


В связи с этим для новых процессоров потребовался и новый разъем — LGA 1155. И хотя он внешне похож на LGA 1156, в нем отсутствует один контакт, а ключ смещен ближе к краю разъема, что не позволяет вставить в него ЦП старого поколения.


Что качается разгона, то максимум чего можно добиться, так это поднятия базовой с номинальных 100 МГц до 105 МГц (+/- один-два мегагерца), чего явно будет недостаточно. Пожалуй, с таким подходом Intel энтузиасты могли бы поставить крест на платформе LGA1155, если бы не одно но — компания все же решила оставить возможность разгона своих процессоров, но только в K-серии и путем поднятия множителя, так как в них он не заблокирован (максимальный x57). Пользователи уже успели познакомиться с подобными моделями на ядрах Lynnfield и Clarkdale. Их аналогов на Sandy Bridge пока два и все они относятся к ценовому диапазону $200-300, что еще больше разочарует оверклокеров, большинство которых вряд ли смогут позволить себе такие процессоры.

Но для самых экономных все-таки была сделана поблажка — в любом обычном процессоре на базе новой архитектуры можно поднять множитель на четыре пункта, не считая турбо-режим. Например, если частота ЦП 3,1 ГГц, то он легко заработает на 3,5 ГГц, при этом технология Turbo Boost будет исправно функционировать. Это, конечно, не разгон в 1,5 раза по частоте, к которому уже привыкли, но все же лучше, чем ничего.


Помимо всего прочего, официальному разгону теперь поддается и графическое ядро, естественно, при использовании материнской платы на соответствующем чипсете. Для производительного ПК потребуется плата на Intel P67 Express, позволяющему разгонять сам процессор, а чтобы воспользоваться встроенным видеядром — на Intel H67 Express. К сожалению, последний лишен возможности управлять множителем ЦП.


Более подробно о них будет рассказано в ближайших материалах на нашем сайте, а в заключении об архитектуре Sandy Bridge стоит упомянуть о реализации поддержки памяти DDR3, максимальный объем которой доведен до 32 Гбайт. Дело в том, что с переходом на раздельное формирование частот основных блоков и разгон процессора путем повышения его множителя, частота памяти всегда постоянна и равна умножению определенного коэффициента на частоту 133 МГц, имеющую соотношение с базовой как 4:3. Количество множителей памяти позволяет использовать ее в режимах от DDR3-800 до DDR3-2400 с шагом 266 МГц. Если рабочая частота модулей не будет кратна 266, они автоматически (при использовании профилей XMP) переведутся в режим с ближайшей меньшей частотой.

После краткого описания архитектурных особенностей Sandy Bridge перейдем к продуктам на ее основе.
Модельный ряд

Процессоры на базе новой микроархитектуры в скором времени должны будут занять все ниши, включая решения начального уровня, где сейчас господствуют продукты с разъемом LGA775. Исключением станет высокопроизводительный сегмент рынка, который отдан на откуп моделям Bloomfield и Lynnfield, хотя в конце этого года все должно будет измениться в пользу Sandy Bridge и ее производных.


На данный момент компания Intel анонсировала 29 моделей новых процессоров, из которых 14 предназначены для настольного рынка. Среди них как обычные (95 Вт), так и с пониженным энергопотреблением (модели с суффиксом S — 65 Вт, и T — 45-35 Вт). Естественно, больший интерес для значительной части пользователей представляют процессоры со стандартным уровнем TDP. Тем более, что на отечественном рынке какие-либо другие вариации встречаются крайне редко.

В представленной ниже таблице приводится список всех стандартных моделей ЦП на базе Sandy Bridge, старшие из которых уже доступны на рынке.

Intel Core i7-2600/2600K* Intel Core i5-2500/2500K* Intel Core i5-2400 Intel Core i5-2300 Intel Core i3-2120 Intel Core i3-2100
Семейство
Разъем LGA1155 LGA1155 LGA1155 LGA1155 LGA1155 LGA1155
Техпроцесс CPU, нм 32 32 32 32 32 32
Число ядер 4
(8 потоков)
4
(4 потока)
4
(4 потока)
4
(4 потока)
2
(4 потока)
2
(4 потока)
Номинальная частота, ГГц 3,4 3,3 3,1 2,8 3,3 3,1
Turbo Boost (шаг поднятия частоты в зависимости от загрузки 1/2/3/4 ядер) 4/3/2/1 4/3/2/1 4/3/2/1 4/3/2/1 - -
Объем L3 кэша, Мбайт 8 6 6 6 3 3
Графическое ядро GMA HD 2000/3000 GMA HD 2000/3000 GMA HD 2000 GMA HD 2000 GMA HD 2000 GMA HD 2000
Частота графического ядра, МГц (номинанальная/турбо-режим) 850/1350 850/1100 850/1100 850/1100 850/1100 850/1100
Каналов памяти 2 2 2 2 2 2
Поддерживаемый тип памяти DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
Hyper-Threading + - - - + +
AES-NI + + + + - -
Intel vPro +/- +/- + - - -
TDP, Вт 95 95 95 95 65 65
Рекомендованная стоимость, $ 294/317 205/216 184 177 138 117
* — множитель разблокирован на повышение.

Как видим, название серий остались прежние — Core i7, Core i5 и Core i3, но изменились номера процессоров, которые стали четырехзначными. Первая цифра обозначает второе поколение Intel Core, следующие три цифры относятся к рейтингу производительности, а суффикс, в данном случае K, означает разблокированный множитель.

В серии Core i7 пока представлены две модели с частотой 3,4 ГГц и кэш-памятью объемом восемь мегабайт. Технология Turbo Boost позволяет поднимать рабочую частоту на 1-4 шага в зависимости от количества загруженных ядер. В процессоре с разблокированным множителем используется более продвинутое видеоядро GMA HD 3000, частота которого может увеличиваться с номинальных 850 МГц до 1350 МГц. Такой ЦП оценен в 317 долларов в партиях по одной тыс. штук. Более доступное решения для энтузиастов относится к серии Core i5 и имеет номер 2500K со стоимостью порядка $216. Процессоры этого модельного ряда оснащены лишь шестью мегабайтами кэша и лишены поддержки технологии Hyper-Threading. Но как покажет наше тестирование, Sandy Bridge неплохо справляется и без нее. Как и в случае со старшими продуктами, режим Turbo Boost и графическое ядро используются аналогичные, только частота GPU может подниматься до 1100 МГц. Для менее производительных Core i5 авторазгон процессора не такой прыткий и имеет шаг 1-2-2-3 (для четырех, трех, двух и одного ядра соответственно). Самые недорогие представители нового поколения относятся к серии Core i3, обладают лишь двумя ядрами и кэш-памятью в три мегабайта, но зато поддерживают Hyper-Threading и могут обрабатывать четыре потока одновременно. Технология Turbo Boost недоступна и для компенсации низкой производительности их частота изначально высокая и стартует с отметки 3,1 ГГц. Поддержка новых инструкций AES-NI ими не предусмотрена. За такие лишения производитель назначил цену около 120-140 долларов за процессор. Осталось лишь дождаться замены нынешнему Celeron, который базируется на уже древней архитектуре пятилетней давности.

Оба они относятся к решениям для энтузиастов и рассчитаны на без проблемный разгон, благодаря разблокированному на повышение множителю. Внешне процессоры Sandy Bridge отличаются от Lynnfield и Clarkdale смещенными к краю ключами и меньшим количеством контактов на лицевой стороне подложки:

Core i7-2600K, Core i5-2500K (слева), Core i5-870 и Core i5-660 (справа)


Частота модели Core i7-2600K составляет 3,4 ГГц, но за счет технологии Turbo Boost она выше на 100 МГц. И чем меньше исполняется потоков, тем она больше растет.


При загрузке трех ядер их частота будет равна 3,6 ГГц, двух — уже 3,7 ГГц, а одного — достигнет своего максимума в 3,8 ГГц. На данный момент, это один из самых высокочастотных процессоров в активе Intel. И в будущих моделях этот предел безболезненно может быть доведен до 4,2-4,5 ГГц.


Следующий участник лишен поддержки Hyper-Threading, обладает объемом кэш-памяти шесть мегабайт и по спецификациям функционирует на 3,3 ГГц. За счет авторазгона фактическая частота, естественно, равна 3,4 ГГц.


В плане работы Turbo Boost ничего не изменилось и частота Core i5-2500K меняется с шагом 100 МГц, пока не достигнет максимальных 3,7 ГГц.


В простое процессоры функционируют на 1600 МГц, при этом напряжение питания снижается с 1,2 до 0,9 В. Во время работы авторазгона оно наоборот, немного повышается (до 1,24 В). В целом, ничего особенного и все характеристики рассматриваемых моделей полностью соответствуют спецификациям на них.

Система охлаждения

Прежде чем перейдем к разгону, стоит пару слов сказать о системах охлаждения для новых процессоров.

К нам на тестирование попали два кулера. Один из них простой, с алюминиевым радиатором и медным пяточком. Частота вращения вентилятора с ШИМ-управлением составляла около 1100-2000 об/мин. Им, вероятнее всего, будут оснащаться все представители архитектуры Sandy Bridge.



Второй охладитель — башенного типа, знакомый нам еще по шестиядерному Core i7-980X Extreme Edition, где он впервые был использован. С небольшими изменениями в его конструкции компания стала им оснащать продукты для энтузиастов прошлого поколения, и даже поставляла кулер на розничный рынок отдельной единицей по названием XTS100H.



В его конструкции применены три тепловые трубки (а не четыре, как у СО Core i7-980X), пронизывающие ряд тонких часто расположенных алюминиевых пластин. Вентилятор с ШИМ-управлением защищен проволочной решеткой и обладает скоростью 800-2600 об/мин (17-45 дБА). Для снижения уровня шума предусмотрен переключатель на крышке кулера, переводящий вентилятор в менее интенсивный режим работы — 800-1400 об/мин.


Основание кулера медное, небольших размеров, но отполировано до зеркального блеска. Крепление XTS100H к плате осуществляется за счет пластиковой усилительной пластины и четырех винтов, и оно вполне надежно.


По эффективности в номинальном режиме работы процессора Core i7-2600K данные системы охлаждения проявляют себя вполне неплохо на фоне недорогого Arctic Cooling Freezer 11 LP и даже Noctua NH-D14.


Но это касается функционирования процессора на стандартной частоте — с разгоном до 4,5-5 ГГц использовать такие кулеры, к сожалению, нельзя.

Разгон

Теперь самое интересное. Наверняка многие сталкивались с проблемой разгона процессоров архитектуры Nehalem на базе 45-нм техпроцесса, которым частоты свыше 4,2 ГГц при воздушном охлаждении давались с трудом. Но никого не удивляли 4,5 ГГц на 32-нм Clarkdale и Gulftown. Помимо самого потенциала ядра свою лепту в проблему разгона вносила высокая частота BCLK, которая получалась с младшими моделями ЦП. С Sandy Bridge повышать частоту можно лишь путем увеличения множителя, предел которого будет определяться уже возможностями процессора K-серии (максимум x57). Для достижения 4,5 ГГц достаточно будет поднять немного напряжение на ядрах, не затрагивая остальные параметры (Turbo Boost обязательно должен быть включен). Тестовые экземпляры Core i7-2600K и Core i5-2500K на такой частоте заработали при повышении напряжения до 1,28 и 1,35 В соответственно, чего вполне достаточно для режима работы системы 24/7. Прибавка еще 200 МГц потребовала увеличение напряжения до 1,3 В для старшей модели и 1,375 В для младшей. Пять гигагерц покорились лишь Core i7-2600K при 1,45 В:


Температура процессора в таком режиме с Noctua NH-D14 не превышала 78°C.

Core i5-2500K смог стабильно функционировать на 4,8 ГГц при напряжении 1,425 В (температура не выходила за рамки 71 градуса по Цельсию) — если младшие все такие, то для серьезных экспериментов с разгоном он явно не подходит.


Для достижения еще большего уровня разгона Sandy Bridge в обязательном порядке необходимо активировать в BIOS/UEFI материнских плат опцию Internal PLL Overvoltage. Можно также попытаться поднять различные напряжения питания. Максимально безопасное для процессора составляет 1,52 В (но есть мнение, что выше 1,38-1,4 В для режима 24/7 использовать не рекомендуется), для «системного агента» — 0,971 В, модулей памяти — 1,57 В. Параметр VCCIO (или Vtt — напряжение на контроллере памяти) позволяет добиться стабильности при работе с высокочастотной памятью, но выше 1,1 В поднимать не рекомендуется. CPU PLL ограничен 1,89 В, а графическое ядро, как и процессорное, может довольствоваться 1,52 В.

Помимо разгона процессора можно увеличить частоту памяти, причем, без каких-либо танцев с бубном, как того требовалось ранее. Достаточно выбрать необходимый режим и, возможно, немного поднять напряжение на контроллере.


Но у этой медали есть и обратная сторона. Так как предел разгона по базовой составляет около 105 МГц, определить максимальную конкретно возможную частоту теперь будет сложно. Придется либо ограничиваться фиксированными режимами, либо подбирать BCLK в пределах 100-105 МГц, что даст прибавку по 20 МГц на каждый мегагерц сверх номинала, что не так уж и много.
Тестовые конфигурации

Для сравнения производительности новых процессоров с решениями прошлого поколения и конкурентами была собрана следующая система:

  • материнская плата: ASUS P8P67 Deluxe (Intel P67 Express, EFI 1053);
  • память: Kingston KHX2000C8D3T1K3/6GX (3x2 ГБ, DDR3-2000@1333, 8-8-8-24-1T);
  • кулер: Noctua NH-D14;
  • видеокарта: ASUS ENGTX580/2DI/1536MD5 (GeForce GTX 580);
  • жесткий диск: Seagate ST3500418AS (500 ГБ, 7200 об/мин, SATAII);
  • блок питания: Seasonic SS-600HM (600 Вт);
  • операционная система: Windows 7 Home Premium x64;
  • драйвер чипсета: Intel Chipset Software Installation Utility 9.2.0.1019;
  • драйвер видеокарты: GeForce 263.09.
В операционной системе брандмауэр, UAC и Windows Defender отключались, файл подкачки устанавливался в размере 4096 МБ. Настройки видеодрайвера не изменялись. Память работала на частоте 1333 МГц с задержками 8-8-8-24-1T. Остальные настройки в UEFI материнской платы оставлялись по умолчанию.

Конфигурации остальных участников отличались процессорами, материнскими платами и, по необходимости, памятью. Для платформы LGA1366 она была следующая:

  • процессор: Intel Core i7-975 EE (3,33 ГГц, 8 Мбайт кэш);
  • материнская плата: ASUS Sabertooth X58 (Intel X58 Express, BIOS 0603).
Платформа LGA1156 комплектовалась таким оборудованием:
  • процессор: Intel Xeon X3470 (взамен Core i7-870; 2,93 ГГц, 8 МБайт кэш);
  • процессор: Intel Core i5-660 (3,33 ГГц, 4 Мбайт кэш);
  • материнская плата: ASUS Maximus III Extreme (Intel P55 Express, BIOS 1204).
Конкурирующий лагерь отстаивал честь следующим:
  • процессор: AMD Phenom II X6 1100T (3,3 ГГц, 6 МБайт кэш);
  • процессор: AMD Phenom II X6 1075T (3,0 ГГц, 6 МБайт кэш);
  • материнская плата: ASUS Crosshair IV Extreme (AMD 890FX, BIOS 0502);
  • память: Goodram Play GY1600D364L8/4GDC (2x2 ГБ, DDR3-1600@1333, 8-8-8-24-1T).
Такой выбор процессоров обусловлен как наличием их на момент тестирования, так и ценовым позиционированием каждой из моделей. Так, стоимость Core i7-2600K (а значит и обычной версии) почти соответствует Core i7-870, а с Core i5-2500K конкурируют Core i5-660 и AMD Phenom II X6 1075T. Модель Phenom II X6 1100T является флагманом компании AMD и занимает среднее положение между линейками Core i7 и Core i5.

Все процессоры тестировались как в номинальном режиме (частота Uncore у Core i7-975 EE составляла 2940 МГц) со всеми включенными технологиями, такими как Hyper-Threading, Turbo Boost и Turbo Core, так и при разгоне до 3,8 ГГц с отключенными функциями авторазгона. Частота памяти всегда держалась на уровне 1333 МГц, представитель AMD разгонялся лишь один, так как разницы при этом между ними фактически не было бы:

  • Core i7-2600K — частота процессора 3800 МГц (38x100), память 1333 МГц (10x133);
  • Core i5-2500K — частота процессора 3800 МГц (38x100), память 1333 МГц (10x133);
  • Core i7-975 EE — частота процессора 3806 МГц (22x173), Uncore 3114 МГц (18x173), QPI 3114 МГц (18x173), память 1384 МГц (8x173);
  • Core i7-870 — частота процессора 3806 МГц (22x173), Uncore 3114 МГц (18x173), QPI 3114 МГц (18x173), память 1384 МГц (8x173);
  • Core i5-660 — частота процессора 3806 МГц (22x173), Uncore 3114 МГц (18x173), QPI 3806 МГц (22x173), память 1384 МГц (8x173);
  • Phenom II X6 1100T — частота процессора 3813 МГц (15,5x246), NB и HT 2214 МГц (9x246), память 1311 МГц (5,33x246).
Результаты тестирования в прикладном ПО

Подсистема памяти




Судя по результатам в программе Aida64 контроллер памяти Sandy Bridge действительно был переработан и демонстрирует высокую производительность, особенно в тесте на запись. Копирование данных происходит быстрее у старшей модели, а Core i5-2500K в этом случае близок по показателям к процессорам предыдущего поколения.


Обойти по латентности контроллер Lynnfield пока не удалось, но разница при стандартном режиме работы минимальна и больше проявляется уже с разгоном. И скорее всего, она будет расти с дальнейшим повышением частоты. Но учитывая потенциал новинок, на это обращать особо не стоит.

Синтетика


В PCMark Vantage рассматриваемые процессоры превосходят своих предшественников. Даже урезанный Sandy Bridge оказался производительнее бывшего флагмана компании Intel. Также достойно себя ведет Core i5-660, хотя в большинстве тестов этого пакета результатами он не блистал. Например, в игровом он хуже остальных решений компании на 20-40%.


Но за счет поддержки инструкций AES-NI в тесте Communications он почти на равных соперничает с двухтысячными моделями.


Отсюда такой высокий итоговый балл. Отметим небольшой проигрыш Core i5-2500K в игровом тесте.

Архивирование



Тестирование в архиваторах осуществлялось путем сжатия папки с различными файлами общим объемом 600 Мбайт. Оба новых процессора демонстрируют чудеса производительности. Двухъядерник Clarkdale не очень приспособлен к такой работе и результат приходится ждать в 1,5 раза дольше, чем с остальными участниками.

Рендеринг



В однопроцессороном тесте Cinebench 11 видна вся мощь архитектуры Sandy Bridge, но с переходом к многопоточному вычислению младший представитель начинает сдавать позиции, хотя и не значительно — он совсем немного отстает от более дорогого Core i7-870. Решения AMD, до этого находившиеся в тени, неожиданно вырвались вперед за счет своих шести ядер.



С POV-Ray такая же ситуация, и чем больше ядер у процессора, тем он производительнее в программе рендеринга.

Математические расчеты


Расчет количества ходов в Fritz Chess Benchmark также зависит от количества ядер или исполняемых потоков и Core i5-2500K опять отстает от Lynnfield. Его даже умудряется обойти Phenom II X6 1075T, и с разгоном разница между ними только увеличивается, вплоть до 16%.



Еще один хорошо оптимизированный под многопоточность бенчмарк. Лидеров в wPrime как таковых нет — все высокоуровневые процессоры обоих производителей показывают одинаковые результаты, которые зависят от частоты той или иной модели. Лишенный Hyper-Threading Sandy Bridge опять отстает, но не так сильно, как Core i5-660.

Работа с видео


Интересная картина наблюдается в x264 HD Benchmark, который производит двухпроходное сжатие видеофайла кодеком H.264. Первый проход на дух не переваривает Hyper-Threading и без этой технологии результат обычно выше, что мы и наблюдаем с Core i5-2500K.


Второй проход наоборот, требует как можно больше вычислительных ядер и полноценный новичок забирает заслуженную пальму первенства назад. Продукты AMD в этом тесте ни чуть не хуже конкурентов. Перспективы Clarkdale на фоне решений новой архитектуры кажутся туманными — им явно осталось на рынке совсем недолго.
Результаты тестирования в игровых приложениях

Синтетика



Теперь перейдем к игровым тестам, начав с синтетики. В 3DMark Vantage расстановка сил была предсказуема, учитывая его оптимизацию под многоядерность. Core i7-2600K безоговорочный лидер, вслед за ним расположились продукты на базе архитектуры Nehalem. Нынешний флагман AMD соперничает лишь с новым четырехъядерником Core i5, немного отставая от него. Но с разгоном они выступают почти вровень.


Новый тест на наших страницах показывает неоднозначные результаты — новинки проигрывают своим предшественникам до 3%. В чем же дело? Почему же 3DMark 11 так не благосклонен к ним? Смотрим на результаты процессорного теста Physics. В нем все закономерно и ничего нового мы не видим.


А вот в графическом подтесте наблюдается падение производительности системы на базе Sandy Bridge, и она пасует даже перед Core i5-660, во что очень трудно поверить.


Возможно, проблема заключается в реализации интерфейса PCI Express или еще чего-нибудь и в будущих версиях тестового пакета или драйверов она будет решена. Пока же можем отметить первое поражение представителей платформы LGA1155.

Игры



В реальных игровых приложениях, например, Crysis, двухтысячные модели смотрятся более привлекательно, особенно, когда 200-долларовый Core i5-2500K не хуже дорогих Lynnfield и Bloomfield.



Стратегия реального времени World in Conflict оказалась не менее чувствительной к новинкам. На фоне таких результатов покупка устаревших решений себя не оправдает. Если, конечно, они прилично не подешевеют.



S.T.A.L.K.E.R.: Call of Pripyat сильно зависит от частоты процессора и емкости его кэша. Если в номинале Core i5-2500K обходит на десяток кадров Core i7-870, то с разгоном последний берет реванш. Но ведь Lynnfield не сможет без проблем работать на частотах 4,5 ГГц, а то и выше, не так ли?

Выводы

Проведя колоссальную работу над ошибками, компания Intel представила микроархитектуру Sandy Bridge с огромным потенциалом, решения на базе которой отличаются высокой производительностью и экономичностью. И хотя ничего революционного в ней нет, именно с нее начнется новый виток развития процессорного рынка. Высокая интеграция и низкий уровень энергопотребления станут неотъемлемой частью будущих продуктов, обрастающих все большим функционалом, что невольно мы уже замечаем сейчас.

Процессоры Sandy Bridge, несмотря на свою среднюю стоимость, предлагают нам новый уровень производительности, ранее доступный лишь с топовыми решениями. Благодаря переработанному контроллеру памяти и некоторым архитектурным изменениям удалось избавиться от многих ограничивающих факторов, сдерживающих дальнейшее развитие архитектуры Nehalem. Но платой за это стала необходимость в новой платформе с разъемом LGA1155, несовместимой с ранее выпущенными решениями. Несмотря на всю привлекательность Sandy Bridge переход на нее с LGA1156 или даже LGA1366 вряд ли оправдает затраты, но она даст возможность наконец-то избавиться от древней LGA775 или же перейти из конкурирующего лагеря. Тем более, что новинка действительно того стоит.

Помимо процессорного ядра было усовершенствовано графическое, расположенное теперь на одном кристалле с остальными блоками. Его функциональность и производительность позволяет конкурировать с дискретными картами начального уровня серии GeForce и Radeon. Пользователям теперь не придется задумываться о покупке недорого адаптера, когда возможности встроенного сильно ограничены.

Энтузиасты оценят разгонный потенциал процессоров на базе очередной микроархитектуры, который благодаря использованию 32-нм техпроцесса вырос до 4,5-5,0 ГГц и выше. Такие частоты доступны при воздушном охлаждении и небольшом повышении питающего напряжения. Для подобных подвигов ранее необходимо было прибегнуть к усиленному охлаждению и серьезному увеличению напряжения питания.

Но какой бы ни была идеальной новая платформа, определенный недостаток в ней обязательно найдется. И в данном случае он касается энтузиастов. Разгонять процессоры теперь можно определенной серии с разблокированным множителем, а не любой, как это было ранее. И все бы ничего, если бы не их стоимость, которая пока находится в пределах 250-350 долларов, что не каждому оверклокеру будет по карману. Здесь явно не хватает более доступной модели, позволяющей экономным энтузиастам, коих большинство, безболезненно перейти на новую платформу.
— процессоры Intel Core i7-2600K, Core i5-2500K, Core i7-975 EE, Xeon X3470 и Core i5-660;

  • Kingston — память Kingston KHX2000C8D3T1K3/6GX;
  • Noctua — кулер Noctua NH-D14 и термопаста Noctua NT-H1;
  • Syntex — блок питания Seasonic SS-600HM;
  • Wilk Elektronik — память Goodram Play GY1600D364L8/4GDC.
  • ВведениеЭтим летом компания Intel совершила странное: она умудрилась сменить целых два поколения процессоров, ориентированных на общеупотребительные персональные компьютеры. Сначала на смену Haswell пришли процессоры с микроархитектурой Broadwell, но затем в течение буквально пары месяцев они утратили свой статус новинки и уступили место процессорам Skylake, которые будут оставаться наиболее прогрессивными CPU как минимум ещё года полтора. Такая чехарда со сменой поколений произошла главным образом в связи с проблемами Intel, возникшими при внедрении нового 14-нм техпроцесса, который применяется при производстве и Broadwell, и Skylake. Производительные носители микроархитектуры Broadwell по пути в настольные системы сильно задержались, а их последователи вышли по заранее намеченному графику, что привело к скомканности анонса процессоров Core пятого поколения и серьёзному сокращению их жизненного цикла. В результате всех этих пертурбаций, в десктопном сегменте Broadwell заняли совсем узкую нишу экономичных процессоров с мощным графическим ядром и довольствуются теперь лишь небольшим уровнем продаж, свойственным узкоспециализированным продуктам. Внимание же передовой части пользователей переключилось на последователей Broadwell – процессоры Skylake.

    Надо заметить, что в последние несколько лет компания Intel совсем не радует своих поклонников ростом производительности предлагаемых продуктов. Каждое новое поколение процессоров прибавляет в удельном быстродействии лишь по несколько процентов, что в конечном итоге приводит к отсутствию у пользователей явных стимулов к модернизации старых систем. Но выход Skylake – поколения CPU, по пути к которому Intel, фактически, перепрыгнула через ступеньку – внушал определённые надежды на то, что мы получим действительно стоящее обновление самой распространённой вычислительной платформы. Однако, ничего подобного так и не случилось: Intel выступила в своём привычном репертуаре. Broadwell был представлен общественности в качестве некого ответвления от основной линии процессоров для настольных систем, а Skylake оказались быстрее Haswell в большинстве приложений совсем незначительно .

    Поэтому несмотря на все ожидания, появление Skylake в продаже вызвало у многих скептическое отношение. Ознакомившись с результатами реальных тестов, многие покупатели попросту не увидели реального смысла в переходе на процессоры Core шестого поколения. И действительно, главным козырем свежих CPU выступает прежде всего новая платформа с ускоренными внутренними интерфейсами, но не новая процессорная микроархитектура. И это значит, что реальных стимулов к обновлению основанных систем прошлых поколений Skylake предлагает немного.

    Впрочем, мы бы всё-таки не стали отговаривать от перехода Skylake всех без исключения пользователей. Дело в том, что пусть Intel и наращивает производительность своих процессоров очень сдержанными темпами, с момента появления Sandy Bridge, которые всё ещё трудятся во многих системах, сменилось уже четыре поколения микроархитектуры. Каждый шаг по пути прогресса вносил свой вклад в увеличение производительности, и к сегодняшнему дню Skylake способен предложить достаточно существенный прирост в производительности по сравнению со своими более ранними предшественниками. Только чтобы увидеть это, сравнивать его надо не с Haswell, а с более ранними представителями семейства Core, появившимися до него.

    Собственно, именно таким сравнением мы сегодня и займёмся. Учитывая всё сказанное, мы решили посмотреть, насколько выросла производительность процессоров Core i7 с 2011 года, и собрали в едином тесте старшие Core i7, относящиеся к поколениям Sandy Bridge, Ivy Bridge, Haswell, Broadwell и Skylake. Получив же результаты такого тестирования, мы постараемся понять, обладателям каких процессоров целесообразно затевать модернизацию старых систем, а кто из них может повременить до появления последующих поколений CPU. Попутно мы посмотрим и на уровень производительности новых процессоров Core i7-5775C и Core i7-6700K поколений Broadwell и Skylake, которые до настоящего момента в нашей лаборатории ещё не тестировались.

    Сравнительные характеристики протестированных CPU

    От Sandy Bridge до Skylake: сравнение удельной производительности

    Для того, чтобы вспомнить, как же менялась удельная производительность интеловских процессоров в течение последней пятилетки, мы решили начать с простого теста, в котором сопоставили скорость работы Sandy Bridge, Ivy Bridge, Haswell, Broadwell и Skylake, приведённых к одной и той же частоте 4,0 ГГц. В этом сравнении нами были использованы процессоры линейки Core i7, то есть, четырёхъядерники, обладающие технологией Hyper-Threading.

    В качестве основного тестового инструмента был взят комплексный тест SYSmark 2014 1.5, который хорош тем, что воспроизводит типичную пользовательскую активность в общеупотребительных приложениях офисного характера, при создании и обработке мультимедийного контента и при решении вычислительных задач. На следующих графиках отображены полученные результаты. Для удобства восприятия они нормированы, за 100 процентов принята производительность Sandy Bridge.



    Интегральный показатель SYSmark 2014 1.5 позволяет сделать следующие наблюдения. Переход от Sandy Bridge к Ivy Bridge увеличил удельную производительность совсем незначительно – примерно на 3-4 процента. Дальнейший шаг к Haswell оказался гораздо более результативным, он вылился в 12-процентное улучшение производительности. И это – максимальный прирост, который можно наблюдать на приведённом графике. Ведь дальше Broadwell обгоняет Haswell всего лишь на 7 процентов, а переход от Broadwell к Skylake и вовсе наращивает удельную производительность лишь на 1-2 процента. Весь же прогресс от Sandy Bridge до Skylake выливается в 26-процентное увеличение производительности при постоянстве тактовых частот.

    Более подробную расшифровку полученных показателей SYSmark 2014 1.5 можно посмотреть на трёх следующих графиках, где интегральный индекс производительности разложен по составляющим по типу приложений.









    Обратите внимание, наиболее заметно с вводом новых версий микроархитектур прибавляют в скорости исполнения мультимедийные приложения. В них микроархитектура Skylake превосходит Sandy Bridge на целых 33 процента. А вот в счётных задачах, напротив, прогресс проявляется меньше всего. И более того, при такой нагрузке шаг от Broadwell к Skylake даже оборачивается небольшим снижением удельной производительности.

    Теперь, когда мы представляем себе, что же происходило с удельной производительностью процессоров Intel в течение последних нескольких лет, давайте попробуем разобраться, чем наблюдаемые изменения были обусловлены.

    От Sandy Bridge до Skylake: что изменилось в процессорах Intel

    Сделать точкой отсчёта в сравнении разных Core i7 представителя поколения Sandy Bridge мы решили не просто так. Именно данный дизайн подвёл крепкий фундамент под всё дальнейшее совершенствование производительных интеловских процессоров вплоть до сегодняшних Skylake. Так, представители семейства Sandy Bridge стали первыми высокоинтегрированными CPU, в которых в одном полупроводниковом кристалле были собраны и вычислительные, и графическое ядра, а также северный мост с L3-кешем и контроллером памяти. Кроме того, в них впервые стала использоваться внутренняя кольцевая шина, посредством которой была решена задача высокоэффективного взаимодействия всех структурных единиц, составляющих столь сложный процессор. Этим заложенным в микроархитектуре Sandy Bridge универсальным принципам построения продолжают следовать все последующие поколения CPU без каких бы то ни было серьёзных корректив.

    Немалые изменения в Sandy Bridge претерпела внутренняя микроархитектура вычислительных ядер. В ней не только была реализована поддержка новых наборов команд AES-NI и AVX, но и нашли применение многочисленные крупные улучшения в недрах исполнительного конвейера. Именно в Sandy Bridge был добавлен отдельный кеш нулевого уровня для декодированных инструкций; появился абсолютно новый блок переупорядочивания команд, основанный на использовании физического регистрового файла; были заметно улучшены алгоритмы предсказания ветвлений; а кроме того, два из трёх исполнительных порта для работы с данными стали унифицированными. Такие разнородные реформы, проведённые сразу на всех этапах конвейера, позволили серьёзно увеличить удельную производительность Sandy Bridge, которая по сравнению с процессорами предыдущего поколения Nehalem сразу выросла почти на 15 процентов. К этому добавился 15-процентный рост номинальных тактовых частот и отличный разгонный потенциал, в результате чего в сумме получилось семейство процессоров, которое до сих пор ставится в пример Intel, как образцовое воплощение фазы «так» в принятой в компании маятниковой концепции разработки.

    И правда, подобных по массовости и действенности улучшений в микроархитектуре после Sandy Bridge мы уже не видели. Все последующие поколения процессорных дизайнов проводят куда менее масштабные усовершенствования в вычислительных ядрах. Возможно, это является отражением отсутствия реальной конкуренции на процессорном рынке, возможно причина замедления прогресса кроется в желании Intel сосредоточить усилия на совершенствовании графических ядер, а может быть Sandy Bridge просто оказался настолько удачным проектом, что его дальнейшее развитие требует слишком больших трудозатрат.

    Отлично иллюстрирует произошедший спад интенсивности инноваций переход от Sandy Bridge к Ivy Bridge. Несмотря на то, что следующее за Sandy Bridge поколение процессоров и было переведено на новую производственную технологию с 22-нм нормами, его тактовые частоты совсем не выросли. Сделанные же улучшения в дизайне в основном коснулись ставшего более гибким контроллера памяти и контроллера шины PCI Express, который получил совместимость с третьей версией данного стандарта. Что же касается непосредственно микроархитектуры вычислительных ядер, то отдельные косметические переделки позволили добиться ускорения выполнения операций деления и небольшого увеличения эффективности технологии Hyper-Threading, да и только. В результате, рост удельной производительности составил не более 5 процентов.

    Вместе с тем, внедрение Ivy Bridge принесло и то, о чём теперь горько жалеет миллионная армия оверклокеров. Начиная с процессоров этого поколения, Intel отказалась от сопряжения полупроводникового кристалла CPU и закрывающей его крышки посредством бесфлюсовой пайки и перешла на заполнение пространства между ними полимерным термоинтерфейсным материалом с очень сомнительными теплопроводящими свойствами. Это искусственно ухудшило частотный потенциал и сделало процессоры Ivy Bridge, как и всех их последователей, заметно менее разгоняемыми по сравнению с очень бодрыми в этом плане «старичками» Sandy Bridge.

    Впрочем, Ivy Bridge – это всего лишь «тик», а потому особых прорывов в этих процессорах никто и не обещал. Однако никакого воодушевляющего роста производительности не принесло и следующее поколение, Haswell, которое, в отличие от Ivy Bridge, относится уже к фазе «так». И это на самом деле немного странно, поскольку различных улучшений в микроархитектуре Haswell сделано немало, причём они рассредоточены по разным частям исполнительного конвейера, что в сумме вполне могло бы увеличить общий темп исполнения команд.

    Например, во входной части конвейера была улучшена результативность предсказания переходов, а очередь декодированных инструкций стала делиться между параллельными потоками, сосуществующими в рамках технологии Hyper-Threading, динамически. Попутно произошло увеличение окна внеочередного исполнения команд, что в сумме должно было поднять долю параллельно выполняемого процессором кода. Непосредственно в исполнительном блоке были добавлены два дополнительных функциональных порта, нацеленных на обработку целочисленных команд, обслуживание ветвлений и сохранение данных. Благодаря этому Haswell стал способен обрабатывать до восьми микроопераций за такт – на треть больше предшественников. Более того, новая микроархитектура удвоила и пропускную способность кеш-памяти первого и второго уровней.

    Таким образом, улучшения в микроархитектуре Haswell не затронули лишь скорость работы декодера, который, похоже, на данный момент стал самым узким местом в современных процессорах Core. Ведь несмотря на внушительный список улучшений, прирост удельной производительности у Haswell по сравнению с Ivy Bridge составил лишь около 5-10 процентов. Но справедливости ради нужно оговориться, что на векторных операциях ускорение заметно гораздо сильнее. А наибольший выигрыш можно увидеть в приложениях, использующих новые AVX2 и FMA-команды, поддержка которых также появилась в этой микроархитектуре.

    Процессоры Haswell, как и Ivy Bridge, сперва тоже не особенно понравились энтузиастам. Особенно если учесть тот факт, что в первоначальной версии никакого увеличения тактовых частот они не предложили. Однако спустя год после своего дебюта Haswell стали казаться заметно привлекательнее. Во-первых, увеличилось количество приложений, обращающихся к наиболее сильным сторонам этой архитектуры и использующих векторные инструкции. Во-вторых, Intel смогла исправить ситуацию с частотами. Более поздние модификации Haswell, получившие собственное кодовое наименование Devil’s Canyon, смогли нарастить преимущество над предшественниками благодаря увеличению тактовой частоты, которая, наконец, пробила 4-гигагерцовый потолок. Кроме того, идя на поводу у оверклокеров, Intel улучшила полимерный термоинтерфейс под процессорной крышкой, что сделало Devil’s Canyon более подходящими объектами для разгона. Конечно, не такими податливыми, как Sandy Bridge, но тем не менее.

    И вот с таким багажом Intel подошла к Broadwell. Поскольку основной ключевой особенностью этих процессоров должна была стать новая технология производства с 14-нм нормами, никаких значительных нововведений в их микроархитектуре не планировалось – это должен был быть почти самый банальный «тик». Всё необходимое для успеха новинок вполне мог бы обеспечить один только тонкий техпроцесс с FinFET-транзисторами второго поколения, в теории позволяющий уменьшить энергопотребление и поднять частоты. Однако практическое внедрение новой технологии обернулось чередой неудач, в результате которых Broadwell досталась лишь экономичность, но не высокие частоты. В итоге те процессоры этого поколения, которые Intel представила для настольных систем, вышли больше похожими на мобильные CPU, чем на продолжателей дела Devil’s Canyon. Тем более, что кроме урезанных тепловых пакетов и откатившихся частот они отличаются от предшественников и уменьшившимся в объёме L3-кешем, что, правда, несколько компенсируется появлением расположенного на отдельном кристалле кэша четвёртого уровня.

    На одинаковой с Haswell частоте процессоры Broadwell демонстрируют примерно 7-процентное преимущество, обеспечиваемое как добавлением дополнительного уровня кеширования данных, так и очередным улучшением алгоритма предсказания ветвлений вместе с увеличением основных внутренних буферов. Кроме того, в Broadwell реализованы новые и более быстрые схемы выполнения инструкций умножения и деления. Однако все эти небольшие улучшения перечёркиваются фиаско с тактовыми частотами, относящими нас в эпоху до Sandy Bridge. Так, например, старший оверклокерский Core i7-5775C поколения Broadwell уступает по частоте Core i7-4790K целых 700 МГц. Понятно, что ожидать какого-то роста производительности на этом фоне бессмысленно, лишь бы обошлось без её серьёзного падения.

    Во многом именно из-за этого Broadwell и оказался непривлекательным для основной массы пользователей. Да, процессоры этого семейства отличаются высокой экономичностью и даже вписываются в тепловой пакет с 65-ваттными рамками, но кого это, по большому счёту, волнует? Разгонный же потенциал первого поколения 14-нм CPU оказался достаточно сдержанным. Ни о какой работе на частотах, приближающихся к 5-гигагерцовой планке речь не идёт. Максимум, которого можно добиться от Broadwell при использовании воздушного охлаждения пролегает в окрестности величины 4,2 ГГц. Иными словами, пятое поколение Core вышло у Intel, как минимум, странноватым. О чём, кстати, микропроцессорный гигант в итоге и пожалел: представители Intel отмечают, что поздний выход Broadwell для настольных компьютеров, его сокращённый жизненный цикл и нетипичные характеристики отрицательно сказались на уровне продаж, и больше компания на подобные эксперименты пускаться не планирует.

    Новейший же Skylake на этом фоне представляется не столько как дальнейшее развитие интеловской микроархитектуры, сколько своего рода работа над ошибками. Несмотря на то, что при производстве этого поколения CPU используется тот же 14-нм техпроцесс, что и в случае Broadwell, никаких проблем с работой на высоких частотах у Skylake нет. Номинальные частоты процессоров Core шестого поколения вернулись к тем показателям, которые были свойственны их 22-нм предшественникам, а разгонный потенциал даже немного увеличился. На руку оверклокерам здесь сыграл тот факт, что в Skylake конвертер питания процессора вновь перекочевал на материнскую плату и снизил тем самым суммарное тепловыделение CPU при разгоне. Жаль только, что Intel так и не вернулась к использованию эффективного термоинтерфейса между кристаллом и процессорной крышкой.

    Но вот что касается базовой микроархитектуры вычислительных ядер, то несмотря на то, что Skylake, как и Haswell, представляет собой воплощение фазы «так», нововведений в ней совсем немного. Причём большинство из них направлено на расширение входной части исполнительного конвейера, остальные же части конвейера остались без каких-либо существенных изменений. Перемены касаются улучшения результативности предсказания ветвлений и повышения эффективности блока предварительной выборки, да и только. При этом часть оптимизаций служит не столько для улучшения производительности, сколько направлена на очередное повышение энергоэффективности. Поэтому удивляться тому, что Skylake по своей удельной производительности почти не отличается от Broadwell, не следует.

    Впрочем, существуют и исключения: в отдельных случаях Skylake могут превосходить предшественников в производительности и более заметно. Дело в том, что в этой микроархитектуре была усовершенствована подсистема памяти. Внутрипроцессорная кольцевая шина стала быстрее, и это в конечном итоге расширило полосу пропускания L3-кэша. Плюс к этому контроллер памяти получил поддержку работающей на высоких частотах памяти стандарта DDR4 SDRAM.

    Но в итоге тем не менее получается, что бы там не говорила Intel о прогрессивности Skylake, с точки зрения обычных пользователей это – достаточно слабое обновление. Основные улучшения в Skylake сделаны в графическом ядре и в энергоэффективности, что открывает перед такими CPU путь в безвентиляторные системы планшетного форм-фактора. Десктопные же представители этого поколения отличаются от тех же Haswell не слишком заметно. Даже если закрыть глаза на существование промежуточного поколения Broadwell, и сопоставлять Skylake напрямую с Haswell, то наблюдаемый рост удельной производительности составит порядка 7-8 процентов, что вряд ли можно назвать впечатляющим проявлением технического прогресса.

    Попутно стоит отметить, что не оправдывает ожиданий и совершенствование технологических производственных процессов. На пути от Sandy Bridge дo Skylake компания Intel сменила две полупроводниковых технологии и уменьшила толщину транзисторных затворов более чем вдвое. Однако современный 14-нм техпроцесс по сравнению с 32-нм технологией пятилетней давности так и не позволил нарастить рабочие частоты процессоров. Все процессоры Core последних пяти поколений имеют очень похожие тактовые частоты, которые если и превышают 4-гигагерцовую отметку, то совсем незначительно.

    Для наглядной иллюстрации этого факта можно посмотреть на следующий график, на котором отображена тактовая частота старших оверклокерских процессоров Core i7 разных поколений.



    Более того, пик тактовой частоты приходится даже не на Skylake. Максимальной частотой могут похвастать процессоры Haswell, относящиеся к подгруппе Devil’s Canyon. Их номинальная частота составляет 4,0 ГГц, но благодаря турбо-режиму в реальных условиях они способны разгоняться до 4,4 ГГц. Для современных же Skylake максимум частоты – всего лишь 4,2 ГГц.

    Всё это, естественно, сказывается на итоговой производительности реальных представителей различных семейств CPU. И далее мы предлагаем посмотреть, как всё это отражается на быстродействии платформ, построенных на базе флагманских процессоров каждого из семейств Sandy Bridge, Ivy Bridge, Haswell, Broadwell и Skylake.

    Как мы тестировали

    В сравнении приняли участие пять процессоров Core i7 разных поколений: Core i7-2700K, Core i7-3770K, Core i7-4790K, Core i7-5775C и Core i7-6700K. Поэтому список комплектующих, задействованных в тестировании, получился достаточно обширным:

    Процессоры:

    Intel Core i7-2600K (Sandy Bridge, 4 ядра + HT, 3,4-3,8 ГГц, 8 Мбайт L3);
    Intel Core i7-3770K (Ivy Bridge, 4 ядра + HT, 3,5-3,9 ГГц, 8 Мбайт L3);
    Intel Core i7-4790K (Haswell Refresh, 4 ядра + HT, 4,0-4,4 ГГц, 8 Мбайт L3);
    Intel Core i7-5775C (Broadwell, 4 ядра, 3,3-3,7 ГГц, 6 Мбайт L3, 128 Мбайт L4).
    Intel Core i7-6700K (Skylake, 4 ядра, 4,0-4,2 ГГц, 8 Мбайт L3).

    Процессорный кулер: Noctua NH-U14S.
    Материнские платы:

    ASUS Z170 Pro Gaming (LGA 1151, Intel Z170);
    ASUS Z97-Pro (LGA 1150, Intel Z97);
    ASUS P8Z77-V Deluxe (LGA1155, Intel Z77).

    Память:

    2x8 Гбайт DDR3-2133 SDRAM, 9-11-11-31 (G.Skill F3-2133C9D-16GTX);
    2x8 Гбайт DDR4-2666 SDRAM, 15-15-15-35 (Corsair Vengeance LPX CMK16GX4M2A2666C16R).

    Видеокарта: NVIDIA GeForce GTX 980 Ti (6 Гбайт/384-бит GDDR5, 1000-1076/7010 МГц).
    Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
    Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).

    Тестирование выполнялось в операционной системе Microsoft Windows 10 Enterprise Build 10240 с использованием следующего комплекта драйверов:

    Intel Chipset Driver 10.1.1.8;
    Intel Management Engine Interface Driver 11.0.0.1157;
    NVIDIA GeForce 358.50 Driver.

    Производительность

    Общая производительность

    Для оценки производительности процессоров в общеупотребительных задачах мы традиционно используем тестовый пакет Bapco SYSmark, моделирующий работу пользователя в реальных распространённых современных офисных программах и приложениях для создания и обработки цифрового контента. Идея теста очень проста: он выдаёт единственную метрику, характеризующую средневзвешенную скорость компьютера при повседневном использовании. После выхода операционной системы Windows 10 этот бенчмарк в очередной раз обновился, и теперь мы задействуем самую последнюю версию – SYSmark 2014 1.5.



    При сравнении Core i7 разных поколений, когда они работают в своих номинальных режимах, результаты получаются совсем не такие, как при сопоставлении на единой тактовой частоте. Всё-таки реальная частота и особенности работы турбо-режима оказывает достаточно существенное влияние на производительность. Например, согласно полученным данным, Core i7-6700K быстрее Core i7-5775C на целых 11 процентов, но при этом его преимущество над Core i7-4790K совсем незначительно – оно составляет всего лишь порядка 3 процентов. При этом нельзя обойти вниманием и то, что новейший Skylake оказывается существенно быстрее процессоров поколений Sandy Bridge и Ivy Bridge. Его преимущество над Core i7-2700K и Core i7-3770K достигает 33 и 28 процентов соответственно.

    Более глубокое понимание результатов SYSmark 2014 1.5 способно дать знакомство с оценками производительности, получаемое в различных сценариях использования системы. Сценарий Office Productivity моделирует типичную офисную работу: подготовку текстов, обработку электронных таблиц, работу с электронной почтой и посещение Интернет-сайтов. Сценарий задействует следующий набор приложений: Adobe Acrobat XI Pro, Google Chrome 32, Microsoft Excel 2013, Microsoft OneNote 2013, Microsoft Outlook 2013, Microsoft PowerPoint 2013, Microsoft Word 2013, WinZip Pro 17.5 Pro.



    В сценарии Media Creation моделируется создание рекламного ролика с использованием предварительно отснятых цифровых изображений и видео. Для этой цели применяются популярные пакеты Adobe Photoshop CS6 Extended, Adobe Premiere Pro CS6 и Trimble SketchUp Pro 2013.



    Сценарий Data/Financial Analysis посвящён статистическому анализу и прогнозированию инвестиций на основе некой финансовой модели. В сценарии используются большие объёмы численных данных и два приложения Microsoft Excel 2013 и WinZip Pro 17.5 Pro.



    Результаты, полученные нами при различных сценариях нагрузки, качественно повторяют общие показатели SYSmark 2014 1.5. Обращает на себя внимание лишь тот факт, что процессор Core i7-4790K совсем не выглядит устаревшим. Он заметно проигрывает новейшему Core i7-6700K только в расчётном сценарии Data/Financial Analysis, а в остальных случаях либо уступает своему последователю на совсем малозаметную величину, либо вообще оказывается быстрее. Например, представитель семейства Haswell опережает новый Skylake в офисных приложениях. Но процессоры более старых годов выпуска, Core i7-2700K и Core i7-3770K, выглядят уже несколько устаревшими предложениями. Они проигрывают новинке в разных типах задач от 25 до 40 процентов, и это, пожалуй, является вполне достаточным основанием, чтобы Core i7-6700K можно было рассматривать в качестве достойной им замены.

    Игровая производительность

    Как известно, производительность платформ, оснащенных высокопроизводительными процессорами, в подавляющем большинстве современных игр определяется мощностью графической подсистемы. Именно поэтому при тестировании процессоров мы выбираем наиболее процессорозависимые игры, а измерение количества кадров выполняем дважды. Первым проходом тесты проводятся без включения сглаживания и с установкой далеко не самых высоких разрешений. Такие настройки позволяют оценить, насколько хорошо проявляют себя процессоры с игровой нагрузкой в принципе, а значит, позволяют строить догадки о том, как будут вести себя тестируемые вычислительные платформы в будущем, когда на рынке появятся более быстрые варианты графических ускорителей. Второй проход выполняется с реалистичными установками – при выборе FullHD-разрешения и максимального уровня полноэкранного сглаживания. На наш взгляд такие результаты не менее интересны, так как они отвечают на часто задаваемый вопрос о том, какой уровень игровой производительности могут обеспечить процессоры прямо сейчас – в современных условиях.

    Впрочем, в этом тестировании мы собрали мощную графическую подсистему, основанную на флагманской видеокарте NVIDIA GeForce GTX 980 Ti. И в результате в части игр частота кадров продемонстрировала зависимость от процессорной производительности даже в FullHD-разрешении.

    Результаты в FullHD-разрешении с максимальными настройками качества


















    Обычно влияние процессоров на игровую производительность, особенно если речь идёт о мощных представителях серии Core i7, оказывается незначительным. Однако при сопоставлении пяти Core i7 разных поколений результаты получаются совсем не однородными. Даже при установке максимальных настроек качества графики Core i7-6700K и Core i7-5775C демонстрируют наивысшую игровую производительность, в то время как более старые Core i7 от них отстают. Так, частота кадров, которая получена в системе с Core i7-6700K превышает производительность системы на базе Core i7-4770K на малозаметный один процент, но процессоры Core i7-2700K и Core i7-3770K представляются уже ощутимо худшей основой геймерской системы. Переход с Core i7-2700K или Core i7-3770K на новейший Core i7-6700K даёт прибавку в числе fps величиной в 5-7 процентов, что способно оказать вполне заметное влияние на качество игрового процесса.

    Увидеть всё это гораздо нагляднее можно в том случае, если на игровую производительность процессоров посмотреть при сниженном качестве изображения, когда частота кадров не упирается в мощность графической подсистемы.

    Результаты при сниженном разрешении


















    Новейшему процессору Core i7-6700K вновь удаётся показать наивысшую производительность среди всех Core i7 последних поколений. Его превосходство над Core i7-5775C составляет порядка 5 процентов, а над Core i7-4690K – около 10 процентов. В этом нет ничего странного: игры достаточно чутко реагируют на скорость подсистемы памяти, а именно по этому направлению в Skylake были сделаны серьёзные улучшения. Но гораздо заметнее превосходство Core i7-6700K над Core i7-2700K и Core i7-3770K. Старший Sandy Bridge отстаёт от новинки на 30-35 процентов, а Ivy Bridge проигрывает ей в районе 20-30 процентов. Иными словами, как бы ни ругали Intel за слишком медленное совершенствование собственных процессоров, компания смогла за прошедшие пять лет на треть повысить скорость работы своих CPU, а это – очень даже ощутимый результат.

    Тестирование в реальных играх завершают результаты популярного синтетического бенчмарка Futuremark 3DMark.









    Вторят игровым показателям и те результаты, которые выдаёт Futuremark 3DMark. При переводе микроархитектуры процессоров Core i7 c Sandy Bridge на Ivy Bridge показатели 3DMark выросли на величину от 2 до 7 процентов. Внедрение дизайна Haswell и выпуск процессоров Devil’s Canyon добавил к производительности старших Core i7 дополнительные 7-14 процентов. Однако потом появление Core i7-5775C, обладающего сравнительно невысокой тактовой частотой, несколько откатило быстродействие назад. И новейшему Core i7-6700K, фактически, пришлось отдуваться сразу за два поколения микроархитектуры. Прирост в итоговом рейтинге 3DMark у нового процессора семейства Skylake по сравнению с Core i7-4790K составил до 7 процентов. И на самом деле это не так много: всё-таки самое заметное улучшение производительности за последние пять лет смогли привнести процессоры Haswell. Последние же поколения десктопных процессоров, действительно, несколько разочаровывают.

    Тесты в приложениях

    В Autodesk 3ds max 2016 мы тестируем скорость финального рендеринга. Измеряется время, затрачиваемое на рендеринг в разрешении 1920x1080 с применением рендерера mental ray одного кадра стандартной сцены Hummer.



    Ещё один тест финального рендеринга проводится нами с использованием популярного свободного пакета построения трёхмерной графики Blender 2.75a. В нём мы измеряем продолжительность построения финальной модели из Blender Cycles Benchmark rev4.



    Для измерения скорости фотореалистичного трёхмерного рендеринга мы воспользовались тестом Cinebench R15. Maxon недавно обновила свой бенчмарк, и теперь он вновь позволяет оценить скорость работы различных платформ при рендеринге в актуальных версиях анимационного пакета Cinema 4D.



    Производительность при работе веб-сайтов и интернет-приложений, построенных с использованием современных технологий, измеряется нами в новом браузере Microsoft Edge 20.10240.16384.0. Для этого применяется специализированный тест WebXPRT 2015, реализующий на HTML5 и JavaScript реально использующиеся в интернет-приложениях алгоритмы.



    Тестирование производительности при обработке графических изображений происходит в Adobe Photoshop CC 2015. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.



    По многочисленным просьбам фотолюбителей мы провели тестирование производительности в графической программе Adobe Photoshop Lightroom 6.1. Тестовый сценарий включает пост-обработку и экспорт в JPEG с разрешением 1920x1080 и максимальным качеством двухсот 12-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Nikon D300.



    В Adobe Premiere Pro CC 2015 тестируется производительность при нелинейном видеомонтаже. Измеряется время рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.



    Для измерения быстродействия процессоров при компрессии информации мы пользуемся архиватором WinRAR 5.3, при помощи которого с максимальной степенью сжатия архивируем папку с различными файлами общим объёмом 1,7 Гбайт.



    Для оценки скорости перекодирования видео в формат H.264 используется тест x264 FHD Benchmark 1.0.1 (64bit), основанный на измерении времени кодирования кодером x264 исходного видео в формат MPEG-4/AVC с разрешением 1920x1080@50fps и настройками по умолчанию. Следует отметить, что результаты этого бенчмарка имеют огромное практическое значение, так как кодер x264 лежит в основе многочисленных популярных утилит для перекодирования, например, HandBrake, MeGUI, VirtualDub и проч. Мы периодически обновляем кодер, используемый для измерений производительности, и в данном тестировании приняла участие версия r2538, в которой реализована поддержка всех современных наборов инструкций, включая и AVX2.



    Кроме того, мы добавили в список тестовых приложений и новый кодер x265, предназначенный для транскодирования видео в перспективный формат H.265/HEVC, который является логическим продолжением H.264 и характеризуется более эффективными алгоритмами сжатия. Для оценки производительности используется исходный 1080p@50FPS Y4M-видеофайл, который перекодируется в формат H.265 с профилем medium. В этом тестировании принял участие релиз кодера версии 1.7.



    Преимущество Core i7-6700K над ранними предшественниками в различных приложениях не подлежит сомнению. Однако больше всего выиграли от произошедшей эволюции два типа задач. Во-первых, связанные с обработкой мультимедийного контента, будь то видео или изображения. Во-вторых, финальный рендеринг в пакетах трёхмерного моделирования и проектирования. В целом, в таких случаях Core i7-6700K превосходит Core i7-2700K не менее, чем на 40-50 процентов. А иногда можно наблюдать и гораздо более впечатляющее улучшение скорости. Так, при перекодировании видео кодеком x265 новейший Core i7-6700K выдаёт ровно вдвое более высокую производительность, чем старичок Core i7-2700K.

    Если же говорить о том приросте в скорости выполнения ресурсоёмких задач, которую может обеспечить Core i7-6700K по сравнению с Core i7-4790K, то тут уже столь впечатляющих иллюстраций к результатам работы интеловских инженеров привести нельзя. Максимальное преимущество новинки наблюдается в Lightroom, здесь Skylake оказался лучше в полтора раза. Но это скорее – исключение из правила. В большинстве же мультимедийных задач Core i7-6700K по сравнению с Core i7-4790K предлагает лишь 10-процентное улучшение производительности. А при нагрузке иного характера разница в быстродействии и того меньше или же вообще отсутствует.

    Отдельно нужно сказать пару слов и о результате, показанном Core i7-5775C. Из-за небольшой тактовой частоты этот процессор медленнее, чем Core i7-4790K и Core i7-6700K. Но не стоит забывать о том, что его ключевой характеристикой является экономичность. И он вполне способен стать одним из лучших вариантов с точки зрения удельной производительности на каждый ватт затраченной электроэнергии. В этом мы легко убедимся в следующем разделе.

    Энергопотребление

    Процессоры Skylake производятся по современному 14-нм технологическому процессу с трёхмерными транзисторами второго поколения, однако, несмотря на это, их тепловой пакет вырос до 91 Вт. Иными словами, новые CPU не только «горячее» 65-ваттных Broadwell, но и превосходят по расчётному тепловыделению Haswell, выпускаемые по 22-нм технологии и уживающиеся в рамках 88-ваттного теплового пакета. Причина, очевидно, состоит в том, что изначально архитектура Skylake оптимизировалась с прицелом не на высокие частоты, а на энергоэффективность и возможность использования в мобильных устройствах. Поэтому для того, чтобы десктопные Skylake получили приемлемые тактовые частоты, лежащие в окрестности 4-гигагерцевой отметки, пришлось задирать напряжение питания, что неминуемо отразилось на энергопотреблении и тепловыделении.

    Впрочем, процессоры Broadwell низкими рабочими напряжениями тоже не отличались, поэтому существует надежда на то, что 91-ваттный тепловой пакет Skylake получили по каким-то формальным обстоятельствам и, на самом деле, они окажутся не прожорливее предшественников. Проверим!

    Используемый нами в тестовой системе новый цифровой блок питания Corsair RM850i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и пользуемся для измерений. На следующем ниже графике приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается. Для правильной оценки энергопотребления мы активировали турборежим и все имеющиеся энергосберегающие технологии.



    В состоянии простоя качественный скачок в экономичности настольных платформ произошёл с выходом Broadwell. Core i7-5775C и Core i7-6700K отличаются заметно более низким потреблением в простое.



    Зато под нагрузкой в виде перекодирования видео самыми экономичными вариантами CPU оказываются Core i7-5775C и Core i7-3770K. Новейший же Core i7-6700K потребляет больше. Его энергетические аппетиты находятся на уровне старшего Sandy Bridge. Правда, в новинке, в отличие от Sandy Bridge, есть поддержка инструкций AVX2, которые требуют достаточно серьёзных энергетических затрат.

    На следующей диаграмме приводится максимальное потребление при нагрузке, создаваемой 64-битной версией утилиты LinX 0.6.5 с поддержкой набора инструкций AVX2, которая базируется на пакете Linpack, отличающемся непомерными энергетическими аппетитами.



    И вновь процессор поколения Broadwell показывает чудеса энергетической эффективности. Однако если смотреть на то, сколько электроэнергии потребляет Core i7-6700K, то становится понятно, что прогресс в микроархитектурах обошёл стороной энергетическую эффективность настольных CPU. Да, в мобильном сегменте с выходом Skylake появились новые предложения с чрезвычайно соблазнительным соотношением производительности и энергопотребления, однако новейшие процессоры для десктопов продолжают потреблять примерно столько же, сколько потребляли их предшественники за пять лет до сегодняшнего дня.

    Выводы

    Проведя тестирование новейшего Core i7-6700K и сравнив его с несколькими поколениями предшествующих CPU, мы вновь приходим к неутешительному выводу о том, что компания Intel продолжает следовать своим негласным принципам и не слишком стремится наращивать быстродействие десктопных процессоров, ориентированных на высокопроизводительные системы. И если по сравнению со старшим Broadwell новинка предлагает примерно 15-процентное улучшение производительности, обусловленное существенно лучшими тактовыми частотами, то в сравнении с более старым, но более быстрым Haswell она уже не кажется столь же прогрессивной. Разница в производительности Core i7-6700K и Core i7-4790K, несмотря на то, что эти процессоры разделяет два поколения микроархитектуры, не превышает 5-10 процентов. И это очень мало для того, чтобы старший десктопный Skylake можно было бы однозначно рекомендовать для обновления имеющихся LGA 1150-систем.

    Впрочем, к столь незначительным шагам Intel в деле повышения скорости работы процессоров для настольных систем стоило бы давно привыкнуть. Прирост быстродействия новых решений, лежащий примерно в таких пределах, – давно сложившаяся традиция. Никаких революционных изменений в вычислительной производительности интеловских CPU, ориентированных на настольные ПК, не происходит уже очень давно. И причины этого вполне понятны: инженеры компании заняты оптимизацией разрабатываемых микроархитектур для мобильных применений и в первую очередь думают об энергоэффективности. Успехи Intel в адаптации собственных архитектур для использования в тонких и лёгких устройствах несомненны, но адептам классических десктопов при этом только и остаётся, что довольствоваться небольшими прибавками быстродействия, которые, к счастью, пока ещё не совсем сошли на нет.

    Однако это совсем не значит, что Core i7-6700K можно рекомендовать лишь для новых систем. Задуматься о модернизации своих компьютеров вполне могут обладатели конфигураций, в основе которых лежит платформа LGA 1155 с процессорами поколений Sandy Bridge и Ivy Bridge. В сравнении с Core i7-2700K и Core i7-3770K новый Core i7-6700K выглядит очень неплохо – его средневзвешенное превосходство над такими предшественниками оценивается в 30-40 процентов. Кроме того, процессоры с микроархитектурой Skylake могут похвастать поддержкой набора инструкций AVX2, который к настоящему моменту нашел достаточно широкое применение в мультимедийных приложениях, и благодаря этому в некоторых случаях Core i7-6700K оказывается быстрее гораздо сильнее. Так, при перекодировании видео мы даже видели случаи, когда Core i7-6700K превосходил Core i7-2700K в скорости работы более чем в два раза!

    Есть у процессоров Skylake и целый ряд других преимуществ, связанных с внедрением сопутствующей им новой платформы LGA 1151. И дело даже не столько в появившейся в ней поддержке DDR4-памяти, сколько в том, что новые наборы логики сотой серии наконец-то получили действительно скоростное соединение с процессором и поддержку большого количества линий PCI Express 3.0. В результате, передовые LGA 1151-системы могут похвастать наличием многочисленных быстрых интерфейсов для подключения накопителей и внешних устройств, которые лишены каких-либо искусственных ограничений по пропускной способности.

    Плюс к тому, оценивая перспективы платформы LGA 1151 и процессоров Skylake, в виду нужно иметь и ещё один момент. Intel не будет спешить с выводом на рынок процессоров следующего поколения, известных как Kaby Lake. Если верить имеющейся информации, представители этой серии процессоров в вариантах для настольных компьютеров появятся на рынке только в 2017 году. Так что Skylake будет с нами ещё долго, и система, построенная на нём, сможет оставаться актуальной в течение очень продолжительного промежутка времени.

    Очередной обзор на тему нового продукта Intel, как правило, начинается с объяснения стратегии процессорного гиганта под названием Тик-Так. Смысл ее заключается в том, что каждые два года миру представляется новая архитектура с промежуточным переходом на более тонкий техпроцесс.


    Благодаря ей, прогресс на рынке не останавливается и мы постоянно сталкиваемся с более функциональными и производительными решениями. Правда, некоторые нововведения не так сильно влияют на производительность, как того хотелось бы. Например, переход от архитектуры Core к Nehalem серьезной прибавки в скорости не принес, но позволил отказаться от привычной шины FSB и сделать ЦП более интегрированным, содержащим в себе не только контроллер памяти, но и графическое ядро. Последним оснащались очень медленные представители семейства Westmere. Следующий шаг Intel призван как раз исправить сложившуюся ситуацию и вывести будущие продукты на новый уровень производительности.

    Семейство процессоров Intel, выполненных по 32-нм технологическим нормам (ядро Clarkdale) оказалось медленнее первых решений на базе архитектуры Nehalem (Bloomfield и Lynnfield). Исключением были шестиядерные Core i7-9xx (Gulftown), лишенные встроенного видеоядра. Такое поведение было обусловлено строением младших представителей Westmere, которые состояли из двух кристаллов. На одном из них располагались вычислительные блоки и кэш, а на другом — контроллеры памяти, шины PCI Express и графическое ядро. Связь между этими половинками осуществлялась за счет интерфейса QPI. Естественно, этот гибрид не смог демонстрировать чудес производительности, даже несмотря на поддержку технологии Hyper-Threading, благодаря которой он лишь конкурировал с младшими четырехъядерными моделями Core 2.

    При такой высокой интеграции использование монолитного кристалла с внутренними широкими шинами для обмена информацией между блоками напрашивается само собой. Пройдя обкатку 32-нм техпроцесса, инженеры компании наконец-то смогли объединить все блоки в одном чипе и даже пересмотрели архитектуру, которая получила название Sandy Bridge.


    Итак, что же в ней такого особенного? Во-первых, как уже отмечалось, все функциональные блоки теперь располагаются на одном кристалле, а количество ядер в производительных моделях процессоров увеличено до четырех. Во-вторых, разделяемая кэш-память третьего уровня стала общей для всех, включая видеоядро, и работает она на частоте процессора, что наилучшим образом скажется на производительности последнего. Кроме того, было увеличено быстродействие графического ядра, а часть северного моста, известная по старым процессорам как Uncore, теперь называется System Agent. И в-третьих, тактовый генератор встроен в чипсет и разгон по базовой частоте теперь потерял свою актуальность. Но обо всем по порядку.


    Основные представители архитектуры Sandy Bridge содержат четыре ядра и поддерживают технологию Hyper-Threading, благодаря которой процессоры могут выполнять восемь потоков одновременно. Кэш-память третьего уровня (или LLC — last level cache, кэш последнего уровня) теперь работает на частоте процессора, имеет объем в восемь мегабайт и может использоваться всеми блоками ЦП, которые в нем нуждаются. Учитывая большое количество потребителей и возможный рост числа ядер в будущих процессорах, инженерам Intel пришлось отказаться от привычной топологии связи между узлами и отдать предпочтение 256-битной кольцевой шине, соединяющей вычислительные ядра, кэш, графический процессор и «системный агент». Пропускная способность такой шины за такт равна произведению количества процессорных ядер на ее ширину. Для четырехъядерного Sandy Bridge с 8 мегабайтами кэша и частотой 3,0 ГГц она составит 384 Гбайт в секунду (96 Гбайт/с на одно соединение), а для двухъядерного — лишь 192 Гбайт/с.


    Объемы кэш-памяти остальных уровней остались без изменений (по 32 Кбайт для инструкций и данных, и 256 Кбайт второго уровня для каждого ядра), но скорость работы с ними теперь выше. Был еще добавлен так называемый L0-кэш на 1,5 тыс. декодированных микроопераций, позволяющий повысить быстродействие процессора и его энергоэффективность.

    System Agent, пришедший на смену Uncore, является аналогом северного моста и содержит контроллеры памяти DDR3 и шин PCI Express, DMI, блок видеовыхода и модуль управления питанием (Power Control Unit, PCU). В отличие от того же Uncore, «системный агент» функционирует отдельно от L3-кэша и не зависит от его частоты и напряжения питания. Ранее связь с кэш-памятью третьего уровня накладывала сильные ограничения при разгоне процессоров, особенно на ядре Bloomfield. Двухканальный контроллер памяти был переработан и его производительность с латентностью теперь не хуже, чем у лучших представителей архитектуры Nehalem. Из поддерживаемой памяти заявлена DDR3-1066 и DDR3-1333, но при использовании материнских плат на чипсете Intel P67 Express можно будет устанавливать модули частотой до 2133 МГц. Количество линий PCI Express 2.0 по сравнению с предшественниками не изменилось и составляет 16 штук. При работе CrossFireX или SLI они могут комбинироваться по восемь линий для каждой видеокарты. «Системный агент», вычислительные ядра с кэшем и графический процессор трактуются отдельно друг от друга и имеют свои напряжения питания. Модуль PCU собирает данные по уровню энергопотребления и тепловыделения этих блоков и управляет их состоянием, переводя либо в экономичный режим работы, либо в производительный. Благодаря раздельной схеме тактования частот, ЦП и видеоядро за счет технологии Turbo Boost 2.0 могут разгоняться независимо друг от друга, и даже сверх нормы уровня TDP, но лишь на непродолжительное время и при условии, что процессор до этого простаивал некоторое время.


    Помимо архитектурных изменений, в новых процессорах появилась поддержка 256-битных инструкций AVX (Advanced Vector Extensions), являющихся дальнейшим развитием SSE и позволяющих увеличить скорость вычислений с плавающей точкой в мультимедиа-приложениях, научных и финансовых задачах. Поддержка инструкций AES-NI, которые появились в Westmere и давали возможность повысить быстродействие шифрования и дешифрования по алгоритму AES, продолжила свое существование и в Sandy Bridge.

    Новое графическое ядро Intel HD Graphics хоть и относится к новому поколению, но существенных архитектурных различий между ним и графическим процессором, встроенным в Clarkdale, нет. Это все те же 12 шейдерных блока (для HD Graphics 3000 и шесть для HD Graphics 2000), но уже с поддержкой DirectX 10.1 и OpenGL 3.0.


    За счет переноса видеоядра на общий с процессором кристалл, выполненный по 32-нм технологическим нормам, стало возможным увеличивать тактовую частоту GPU до 1,35 ГГц. Это может положительно сказаться на быстродействии видеоподсистемы, вплоть до конкуренции с дискретными графическими адаптерами начального уровня AMD и NVIDIA. Но даже на такой частоте скорость в игровых приложениях все равно будет оставлять желать лучшего. В новой версии Intel HD Graphics скорее будет интересна возможность аппаратного кодирования видео формата MPEG2 и H.264, новые фильтры пост-обработки и поддержка HDMI 1.4 с Blu-Ray 3D.


    Конечно, вышеперечисленные изменения призваны увеличить производительность новых решений, но самое серьезное нововведение в Sandy Bridge, пожалуй, будет перенесение генератора базовой частоты в набор системной логики. Он единственный и от него зависят все частоты различных узлов и блоков, как самого процессора, так и чипсета. По этой причине базовая частота составляет 100 МГц и при ее повышении будут расти частота не только процессора, но и всевозможных шин и контроллеров, а это серьезно скажется на стабильности системы во время разгона.


    В связи с этим для новых процессоров потребовался и новый разъем — LGA 1155. И хотя он внешне похож на LGA 1156, в нем отсутствует один контакт, а ключ смещен ближе к краю разъема, что не позволяет вставить в него ЦП старого поколения.


    Что качается разгона, то максимум чего можно добиться, так это поднятия базовой с номинальных 100 МГц до 105 МГц (+/- один-два мегагерца), чего явно будет недостаточно. Пожалуй, с таким подходом Intel энтузиасты могли бы поставить крест на платформе LGA1155, если бы не одно но — компания все же решила оставить возможность разгона своих процессоров, но только в K-серии и путем поднятия множителя, так как в них он не заблокирован (максимальный x57). Пользователи уже успели познакомиться с подобными моделями на ядрах Lynnfield и Clarkdale. Их аналогов на Sandy Bridge пока два и все они относятся к ценовому диапазону $200-300, что еще больше разочарует оверклокеров, большинство которых вряд ли смогут позволить себе такие процессоры.

    Но для самых экономных все-таки была сделана поблажка — в любом обычном процессоре на базе новой архитектуры можно поднять множитель на четыре пункта, не считая турбо-режим. Например, если частота ЦП 3,1 ГГц, то он легко заработает на 3,5 ГГц, при этом технология Turbo Boost будет исправно функционировать. Это, конечно, не разгон в 1,5 раза по частоте, к которому уже привыкли, но все же лучше, чем ничего.


    Помимо всего прочего, официальному разгону теперь поддается и графическое ядро, естественно, при использовании материнской платы на соответствующем чипсете. Для производительного ПК потребуется плата на Intel P67 Express, позволяющему разгонять сам процессор, а чтобы воспользоваться встроенным видеядром — на Intel H67 Express. К сожалению, последний лишен возможности управлять множителем ЦП.


    Более подробно о них будет рассказано в ближайших материалах на нашем сайте, а в заключении об архитектуре Sandy Bridge стоит упомянуть о реализации поддержки памяти DDR3, максимальный объем которой доведен до 32 Гбайт. Дело в том, что с переходом на раздельное формирование частот основных блоков и разгон процессора путем повышения его множителя, частота памяти всегда постоянна и равна умножению определенного коэффициента на частоту 133 МГц, имеющую соотношение с базовой как 4:3. Количество множителей памяти позволяет использовать ее в режимах от DDR3-800 до DDR3-2400 с шагом 266 МГц. Если рабочая частота модулей не будет кратна 266, они автоматически (при использовании профилей XMP) переведутся в режим с ближайшей меньшей частотой.

    После краткого описания архитектурных особенностей Sandy Bridge перейдем к продуктам на ее основе.

    В эти дни компания Intel представляет миру долгожданные процессоры Sandy Bridge , архитектура которых заранее была окрещена как революционная. Но не только процессоры стали новинками этих дней, а и все сопутствующие компоненты новых настольной и мобильной платформ.

    Итак, на этой неделе анонсировано аж 29 новых процессоров, 10 чипсетов и 4 беспроводных адаптера для ноутбуков и настольных рабочих и игровых компьютеров.

    К мобильным новинкам относятся:

      процессоры Intel Core i7-2920XM, Core i7-2820QM, Core i7-2720QM, Core i7-2630QM, Core i7-2620M, Core i7-2649M, Core i7-2629M, Core i7-2657M, Core i7-2617M, Core i5-2540M, Core i5-2520M, Core i5-2410M, Core i5-2537M, Core i3-2310M;

      чипсеты Intel QS67, QM67, HM67, HM65, UM67 Express;

      беспроводные сетевые контроллеры Intel Centrino Advanced-N + WiMAX 6150, Centrino Advanced-N 6230, Centrino Advanced-N 6205, Centrino Wireless-N 1030.

    В настольном же сегменте появятся:

      процессоры Intel Core i7-2600K, Core i7-2600S, Core i7-2600, Core i5-2500K, Core i5-2500S, Core i5-2500T, Core i5-2500, Core i5-2400, Core i5-2400S, Core i5-2390T, Core i5-2300;

      чипсеты Intel P67, H67, Q67, Q65, B65 Express.

    Но сразу же стоит отметить, что анонс новой платформы не является одночастным для всех моделей процессоров и чипсетов – с начала января доступны только решения класса «майнстрим», а большинство более массовых и не таких дорогих появятся в продаже немного позднее. Вместе с выпуском настольных процессоров Sandy Bridge представлен и новый процессорный разъем для них LGA 1155 . Таким образом, новинки не дополняют модельный ряд Intel Core i3/i5/i7, а являются заменой для процессоров под LGA 1156, большинство из которых теперь становятся совсем неперспективным приобретением, ибо в ближайшее время их выпуск вообще должен прекратиться. И только для энтузиастов до конца года Intel обещает продолжать выпуск старших четырехъядерных моделей на ядре Lynnfield.

    Однако, судя по «роадмапу» платформа долгожитель Socket T (LGA 775) все еще будет оставаться актуальной как минимум до середины года, являясь основой для систем начального уровня. Для наиболее же производительных игровых систем и настоящих энтузиастов до конца года будут актуальны процессоры на ядре Bloomfield по разъем LGA 1366. Как видим, жизненный цикл двухъядерных процессоров с «интегрированным» графическим адаптером на ядре Clarkdale оказался очень коротки, всего один год, но именно они «протоптали» дорожку для представленных «сегодня» Sandy Bridge, приучив потребителя к мысли, что в процессоре может быть интегрирован не только контроллер памяти, а и видеокарта. Теперь же пришло время не просто выпустить более быстрые версии подобных процессоров, серьезно обновить архитектуру, чтобы обеспечить заметное увеличение их эффективности.

    Ключевыми особенностями процессоров архитектуры Sandy Bridge являются:

      выпуск с соблюдением 32 нм техпроцесса;

      заметно увеличившаяся энергоэффективность;

      оптимизированная технология Intel Turbo Boost и поддержка Intel Hyper-Threading;

      значительное увеличение производительности встроенного графического ядра;

      реализация нового набора инструкций Intel Advanced Vector Extension (AVX) для ускорения обработки вещественных чисел.

    Но все вышеуказанные нововведения не обеспечивали бы возможности говорить о действительно новой архитектуре, если бы все это не было реализовано теперь в пределах одного ядра (кристалла), в отличие от процессоров на ядре Clarkdale.

    Естественно, чтобы все узлы процессора заработали согласовано, нужно было организовать быстрый обмен информацией между ними – важным архитектурным нововведением стала кольцевая шина Ring Interconnect.

    Объединяет же Ring Interconnect через кэш-память L3, теперь называемую LLC (Last Level Cache), процессорные ядра, графическое ядро и системный агент (System Agent), включающий в себя контроллер памяти, контроллер шины PCI Express, контроллер DMI, модуль управления питанием и другие контроллеры и модули, ранее имеющие объединенные названием «uncore».

    Кольцевая шина Ring Interconnect является следующим этапом развития шины QPI (QuickPath Interconnect), которая после «обкатки» в серверных процессорах с обновленной 8-ядерной архитектурой Nehalem-EX, перекочевала и в ядро процессоров для настольных и мобильных систем. Посредством Ring Interconnect образуются четыре 32-разрядных кольца для шин Данных (Data Ring), Запросов (Request Ring), Мониторинга состояния (Snoop Ring) и Подтверждения (Acknowledge Ring). Функционирует кольцевая шина на частоте ядер, поэтому её пропускная способность, задержки и энергопотребление полностью зависят от частоты работы вычислительных блоков процессора.

    Кэш-память третьего уровня (LLC - Last Level Cache) является общей для всех вычислительных ядер, графического ядра, системного агента и других блоков. При этом графический драйвер определяет какие потоки данных разместить в кэш-памяти, но и любой другой блок может получить доступ ко всем данным в LLC. Специальный механизм контролирует распределение кэш-памяти, чтобы не возникло коллизий. В целях ускорения работы для каждого из процессорных ядер выделен «свой» сегмент кэш-памяти, к которому оно имеет прямой доступ. Каждый такой сегмент включает независимый контроллер доступа к шине Ring Interconnect, но при этом ведется постоянное взаимодействие с системным агентом, который производит общее управление кэш-памятью.

    Системный агент (System Agent), по сути, является встроенным в процессор «северным мостом» и объединяет контроллеры шин PCI Express, DMI, оперативной памяти, блок обработки видео (медиапроцессор и управление интерфейсами), диспетчер питания и другие вспомогательные блоки. С остальными узлами процессора системный агент взаимодействует через кольцевую шину. Кроме упорядочения потоков данных, системный агент следит за температурой и загрузкой различных блоков, и через Power Control Unit обеспечивает управление напряжением питания и частотами, дабы обеспечить наилучшую энергоэффективность при высокой производительности. Здесь же можно отметить, что для питания новых процессоров нужно трехкомпонентный стабилизатор питания (или двух, если встроенное видеоядро останется неактивным) – отдельно для вычислительных ядер, системного агента и интегрированной видеокарты.

    Встроенная в процессор шина PCI Express соответствует спецификации 2.0 и насчитывает 16 линий для возможности увеличения мощности графической подсистемы при помощи мощного внешнего 3D-ускорителя. В случае использования старших наборов системной логики и согласования лицензионных вопросов эти 16 линий могут быть разделены на 2 или три слота в режимах 8x+8x или 8x+4x+4x соответственно для NVIDIA SLI и/или AMD CrossFireX.

    Для обмена данными с системой (накопителями, портами ввода-вывода, периферией, контроллеры которых находятся в чипсете) используется шина DMI 2.0, позволяющая прокачать до 2 ГБ/с полезной информации в обоих направлениях.

    Важной частью системного агента является встроенный в процессор двухканальный контроллер памяти DDR3, номинально поддерживающий модули на частоте 1066-1333 МГц, но при использовании в материнских платах на чипсете Intel P67 Express без проблем обеспечивающий функционирование модулей на частоте до 1600 и даже 2133 МГц. Размещение контроллера памяти в одном кристалле с процессорными ядрами (ядро Clarkdale состояло из двух кристаллов) должно уменьшить латентность памяти и, соответственно, увеличить производительность системы.

    Отчасти благодаря расширенному мониторингу параметров всех вычислительных ядер, кэш-памяти и вспомогательных блоков, который реализован в Power Control Unit, в процессорах Sandy Bridge появилась усовершенствованная технология Intel Turbo Boost 2.0. Теперь, в зависимости от нагрузки и выполняемых задач, ядра процессора при высокой необходимости могут ускоряться даже с превышением теплового пакета, как при обычном ручном разгоне. Но системный агент будет следить за температурой процессора и его компонентов, и когда будет зафиксирован «перегрев» частоты узлов будут постепенно уменьшаться. Однако в настольных процессорах лимитировано время работы в сверхускоренном режиме, т.к. здесь значительно легче организовать в разы более эффективное охлаждение, чем «боксовый» кулер. Такой «овербуст» позволит получить прибавку производительности в критичные для системы моменты, что должно создать у пользователя впечатление работы с более мощной системой, а также уменьшить время ожидания реакции системы. Также Intel Turbo Boost 2.0 гарантирует, что и в настольных компьютерах встроенное видеоядро имеет динамическую производительность.

    Архитектура процессоров Sandy Bridge подразумевает не только изменения в структуре межкомпонентного взаимодействия и улучшение возможностей и энергоэффективности этих компонентов, но и внутренние изменения в каждом вычислительном ядре. Если отбросить «косметические» улучшения, то наиболее важными окажутся следующие:

      возврат к выделению кэш-памяти для примерно 1,5 тысяч декодированных микроопераций L0 (использовался в Pentium 4), являющейся обособленной частью L1, что позволяет одновременно обеспечить более равномерную загрузку конвейеров и снизить энергопотребление вследствие увеличения пауз в работе достаточно сложных схем декодеров операций;

      повышение эффективности блока предсказания ветвлений вследствие увеличение емкости буферов адресов результатов ветвления, истории команд, истории ветвлений, что увеличило эффективность конвейеров;

      увеличение емкости буфера переупорядоченных команд (ROB - ReOrder Buffer) и повышение эффективности этой части процессора благодаря внедрению физического регистрового файла (PRF – Physical Register File, тоже характерной особенности Pentium 4) для хранения данных, а также расширение других буферов;

      удвоение емкости регистров для работы с потоковыми вещественными данными, что в ряде случаев может обеспечить в два раза большую скорость выполнения операций, их использующих;

      увеличение эффективности исполнения инструкций шифрования для алгоритмов AES, RSA и SHA;

      введение новых векторных инструкций Advanced Vector Extension (AVX);

    • оптимизацию работы кэш-памяти первого L1 и второго L2 уровней.

    Важной особенностью графического ядра процессоров Sandy Bridge является то, что оно теперь находится в одном кристалле с остальными блоками, а управление его характеристиками и слежение за состоянием выполняет на аппаратном уровне системный агент. При этом блок обработки медиаданных и формирования сигналов для видеовыходов вынесен в этот самый системный агент. Такая интеграция обеспечивает более тесное взаимодействие, меньшие задержки, большую эффективность и т.д.

    Однако самой архитектуре графического ядра не так много изменений, как того хотелось бы. Вместо ожидаемой поддержки DirectX 11 была просто добавлена поддержка DirectX 10.1. Соответственно и не многие приложения с поддержкой OpenGL ограничены аппаратной совместимостью только с 3-й версией спецификации этого свободного API. При этом, хотя и говорится об усовершенствовании вычислительных блоков, но их осталось столько же – 12, и то только для старших процессоров. Однако увеличение тактовой частоты до 1350 МГц обещает заметный прирост производительности в любом случае.

    С другой стороны, создать встроенное видеоядро с действительно высокой производительностью и функциональностью для современных игр при невысоком его энергопотреблении очень тяжело. Поэтому отсутствие поддержки новых API повлияет лишь на совместимость с новыми играми, а производительность при действительно большом желании комфортно играть нужно будет наращивать с помощью дискретного 3D-ускорителя. А вот расширение функциональности при работе с мультимедийными данными, в первую очередь при кодировании и декодировании видео в рамках Intel Clear Video Technology HD, можно причислить к достоинствам Intel HD Graphics II (Intel HD Graphics 2000/3000).

    Обновленный медиапроцессор позволяет разгрузить процессорные ядра при кодировании видео в форматах MPEG2 и H.264, а также расширяет набор пост-процессинговых функций аппаратной реализацией алгоритмов для автоматической подстройки контрастности изображения (ACE – Adaptive Contrast Enhancement), корректировки цветов (TCC – Total Color Control) и улучшения отображения кожи (STE – Skin Tone Enhancement). Повышает перспективность использования встроенной видеокарты реализованная поддержка интерфейса HDMI версии 1.4, совместимой с Blu-ray 3D (Intel InTru 3D).

    Все выше перечисленные архитектурные особенности обеспечивают новому поколению процессоров заметное превосходство по быстродействию над моделями предыдущего поколения, как в вычислительных задачах, так и при работе с видео.

    В итоге платформа Intel LGA 1155 становится более производительной и функциональной, приходя на смену LGA 1156.

    Если подытожить, то процессоры семейства Sandy Bridge спроектированы для решения очень широкого круга задач при высокой энергоэффективности, что должно их сделать действительно массовыми в новых производительных системах, особенно когда в продаже появятся более доступные модели в широком ассортименте.

    В ближайшее время постепенно покупателям станут доступны 8 процессоров для настольных систем разного уровня: Intel Core i7-2600K, Intel Core i7-2600, Intel Core i5-2500K, Intel Core i5-2500, Intel Core i5-2400, Intel Core i5-2300, Intel Core i3-2120 и Intel Core i3-2100. Модели с индексом K отличаются свободным множителем и более быстрым встроенным видеоадаптером Intel HD Graphics 3000.

    Также для критичных к энергопотреблению систем выпущены энергоэффективные (индекс S) и высокоэнергоэффективные (индекс T) модели.

    Для поддержки новых процессоров уже сегодня доступны материнские платы на чипсетах Intel P67 Express и Intel H67 Express, в а недалеком будущем ожидаются на Intel Q67 Express и Intel B65 Express, ориентированные на корпоративных пользователей и малый бизнес. Все эти чипсеты наконец-то начали поддерживать накопители с интерфейсом SATA 3.0, хотя и не всеми портами. А вот поддержки, казалось бы даже более востребованной шины USB 3.0 в них нет. Интересными особенностями новых чипсетов для обычных материнских плат стало то, что в них отказались от поддержки шины PCI. Кроме того, теперь тактовый генератор встроен в чипсет и управлять его характеристиками без последствий для стабильности работы системы можно лишь в очень небольшом диапазоне, если повезет то всего ±10 МГц, а на практике и того меньше.

    Также нужно отметить, что разные чипсеты оптимизированы под использование с разными процессорами в системах, предназначенных для различных целей. То есть Intel P67 Express от Intel H67 Express отличается не только отсутствием поддержки работы со встроенным видео, но и расширенными возможностями для «оверклокинга» и тюнинга производительности. В свою очередь Intel H67 Express вообще не замечает свободный множитель у моделей с индексом K.

    А ведь вследствие архитектурных особенностей, разгон процессоров Sandy Bridge пока возможен только с помощью множителя, если это модель K-серии. Хотя к некоторой оптимизации и «овербусту» склонны все модели.

    Таким образом, временно для создания иллюзии работы на очень мощном процессоре даже модели с заблокированным множителем способны на заметное ускорение. Время такого ускорения для настольных систем, как было упомянуто выше, ограничено аппаратно, а не только температурой, как в мобильных ПК.

    После представления всех архитектурных особенностей и нововведений, а также обновленных фирменных технологий, остается только еще раз просуммировать, чем же Sandy Bridge такие инновационные и напомнить о позиционировании.

    Для высокопроизводительных и массовых производительных систем в ближайшее время можно будет купить процессоры серий Intel Core i7 и Intel Core i5, которые между собой отличаются поддержкой технологии Intel Hyper-Threading (для четырехъядерных моделей Intel Core i5 она отключена) и объемом кэш-памяти третьего уровня. Для более экономных покупателей представлены новые модели Intel Core i3, которые имеют в 2 раза меньше вычислительных ядер, хоть и с поддержкой Intel Hyper-Threading, всего 3 МБ кэш-памяти LLC, не поддерживают Intel Turbo Boost 2.0 и все укомплектованы Intel HD Graphics 2000.

    В середине года для массовых систем будут представлены процессоры Intel Pentium (от этого бренда очень тяжело отказаться, хотя еще год назад это пророчили) на основе очень упрощенной архитектуры Sandy Bridge. Фактически эти процессоры для «рабочих лошадок» будут напоминать по возможностям еще вчера актуальные Core i3-3xx на ядре Clarkdale, т.к. практически всех функций, присущих старшим моделям для LGA 1155, они лишатся.

    Остается отметить, что выпуск процессоров Sandy Bridge и целой настольной платформы LGA 1155 стал очередным «Так» в рамках концепции Intel «Тик-Так», т.е. серьезным обновлением архитектуры для выпуска по уже отлаженному 32 нм техпроцессу. Примерно через год нас будут ждать процессоры Ivy Bridge с оптимизированной архитектурой и выполненные по 22 нм техпроцессу, которые, наверняка, снова будут иметь «революционную энергоэффективность», но, надеемся, не упразднят процессорный разъем LGA 1155. Что ж, подождем – увидим. А пока у нас есть минимум год на изучение архитектуры Sandy Bridge и её всестороннее тестирование, к чему и собираемся приступить уже в ближайшие дни .

    Статья прочитана 14572 раз(а)

    Подписаться на наши каналы

    ", опубликованном примерно год назад, мы говорили о микроархитектуре Nehalem, пришедшей на смену Core в конце 2008 года. В этом обзоре речь пойдёт об архитектуре Sandy Bridge, которая в самое ближайшее время должна полностью заменить Nehalem.

    На сегодняшний день чипы на базе Sandy Bridge представлены во всех линейках процессоров Intel, включая серверные Xeon, дестопные и мобильные Core i3/35/i7, Pentium и Celeron и "экстремальные" Core i7 Extreme. Незадолго до публикации этой статьи, 22 мая 2011 года, были представлены ещё семь новых процессоров на основе Sandy Bridge.

    В чём же заключаются принципиальные отличия Sandy Bridge от Nehalem и в чём состоят особенности и преимущества новой микроархитектуры Intel? Вкратце эти отличия таковы: обновлённое графическое ядро в составе "системного агента" расположено на одном кристалле с вычислительным, предусмотрены новый буфер микрокоманд L0, разделяемый кэш L3, модернизированная технология Turbo Boost, расширенный набор инструкций SIMD AVX и переработанный двухканальный контроллер оперативной памяти DDR3 1333 МГц. Вместе с новой архитектурой появился и новый процессорный разъём LGA 1155.

    Одно из главных конструктивных отличий Sandy Bridge от Nehalem - размещение вычислительных ядер и северного моста (системного агента) на одном кристалле. Напомним, что в Nehalem сам ЦП и северный мост располагались под общей крышкой, но фактически размещались на самостоятельных чипах, которые, к тому же, были выполнены по разным технологическим нормам: ЦП - по 32-нм, а северный мост - по 45-нм. В Sandy Bridge это единый кристалл, выполненный по 32-нм техпроцессу, на котором находятся вычислительные ядра, графическое ядро, контроллеры оперативной памяти, PCI Express, электропитания (Power Control Unit, PCU) и блок видеовыхода.

    Новый набор SIMD-инструкций в чипах Sandy Bridge получил название AVX - Advanced Vector Extensions, то есть "расширенные векторные инструкции". Фактически это очередное поколение SIMD-инструкций (Single Instruction, Multiple Data - "одиночный поток команд, множественный поток данных" SSE5, альтернативная набору x86, разработанному в AMD. Разрядность регистров XMM в инструкциях AVX увеличен вдвое с 128 до 256 бит, появились 12 новых инструкций с поддержкой четырёхоперандных команд. Поддерживаются технология аппаратного шифрования Advanced Encryption Standard (AES) и система виртуализации Virtual Machine Extensions (VMX).

    Несмотря на схожую конструкцию, у чипов Sandy Bridge больше исполнительных блоков, чем у Nehalem: 15 против 12 (см. блок-схему). Каждый исполнительный блок подключён к планировщику инструкций через 128-битный канал. Для выполнения новых инструкций AVX, содержащих 256-разрядные данные, одновременно используются два исполнительных блока.

    Чипы Sandy Bridge cпособны обрабатывать до четырёх инструкций за такт благодаря четырём декодерам, встроенным в блоки выборки команд. Эти декодеры преобразуют инструкции x86 в простые RISC-подобные микроинструкции.

    Важнейшее нововведение в процессорах Sandy Bridge - это так называемый "кэш нулевого уровня" L0, в принципе отсутствовавший в процессорах предыдущего поколения. Этот кэш способен хранить до 1536 декодированных микроинструкций: его смысл заключается в том, что когда исполняемая программа входит в кольцевой цикл, то есть повторно выполняет одни и те же инструкции, не требуется заново декодировать одни и те же инструкции. Такая схема позволяет заметно повысить производительность: по оценкам специалистов Intel, L0 используется в 80% машинного времени, то есть в подавляющем большинстве случаев. Кроме того, при использовании L0 отключаются декодеры и кэш-память первого уровня, а чип потребляет меньше энергии и выделяет меньше тепла.

    В связи с появлением в чипах Sandy Bridge "кэша нулевого уровня" часто вспоминают трассировочный кэш (trace cache) "ветеранов гонки гигагерц" - процессоров Pentium 4 на базе архитектуры NetBurst. Между тем, эти буферы работают по-разному: в трассировочном кэше инструкции записываются точно в таком порядке, в каком они исполнялись, поэтому в нём могут несколько раз повторяться одни и те же инструкции. В L0 хранятся единичные инструкции, что, разумеется, более рационально.

    Претерпел заметные изменения блок предсказания ветвлений, получивший буфер предсказания результата ветвлений (branch target buffer) удвоенного объёма. Кроме того, в буфере теперь используется специальный алгоритм сжатия данных, благодаря чему блок способен подготавливать большие объёмы инструкций, тем самым повышая производительность расчётов.

    Подсистема памяти в Sandy Brigde была также оптимизирована для работы с 256-битными инструкциями AVX. Напомним, что в Nehalem использовались выделенные порты загрузки, хранения адресов и хранения данных, привязанные к отдельным дисптчерским портам, что означает возможность загрузки 128 бит данных из кэш-памяти L1 за такт. В Sandy Brigde порты загрузки и хранения при необходимости могут изменять назначение и одновременно выступать в роли пары портов загрузки или хранения, что позволяет работать с 256 битами данных за такт.

    Для связи компонентов чипа, то есть вычислительных ядер, кэш-памяти L3, графического ядра и системного агента (контроллеров памяти, PCI Express, питания и дисплея), Sandy Bridge используется кольцевая шина (ring interconnect). За основу была взята скоростная шина QPI (Quick Path Interconnect, пропускная способность до 6,4 Гбайт/с на частоте 3,2 ГГц), впервые реализованная в чипах Nehalem Lynnfield (Core i7 9xxx для Socket LGA1366), адресованных энтузиастам.

    По сути кольцевая шина в Sandy Bridge представляет собой четыре 32-байных кольца: шины данных, шины запросов, шины подтверждения и шины мониторинга. Обработка запросов осуществляется на частоте работы вычислительных ядер, при этом при тактовой частоте 3 ГГц пропускная способность шины достигает 96 Гбайт в секунду. При этом система автоматически определяет кратчайший путь передачи данных, обеспечивая минимальную латентность.

    Использование кольцевой шины позволило иным способом реализовать кэш-память третьего уровня L3, которая в Sandy Bridge получила название LLC (Last Level Cache, то есть "кэш последнего уровня"). В отличие от Nehalem, здесь LLC не является общим для всех ядер, но при этом он может при необходимости распределяться между всеми ядрами, а также графикой и системным агентом. Важно отметить, что хотя для каждого вычислительного ядра выделен свой сегмент LLC, этот сегмент не привязан жёстко к "своему" ядру и его объём может посредством кольцевой шины распределяться между другими компонентами.

    При переходе на Sandy Bridge в Intel присвоили всем компонентами центрального процессора, которые не относятся к собственно вычислительным ядрам, общее названием System Agent, то есть "системный агент". Фактически это всё компоненты так называемого "северного моста" набора системной логики, однако это название всё-таки больше подходит отдельной микросхеме. В применении к Nehalem использовалось странное и явно неудачное наименование "Uncore", то есть "неядро", так что "системный агент" звучит намного уместнее.

    К основным элементам "системного агента" следует отнести модернизированный двухканальный контроллер оперативной памяти DDR3 до 1333 МГц, контроллер PCI Express 2.0 с поддержкой одной шины x16, двух шин x8 или одной шины x8 и двух x4. В чипе имеется специальный блок управления питанием, на основе которого реализована технология автоматического разгона Turbo Boost нового поколения. Благодаря этой технологии, учитывающей состояние как вычислительных, так и графических ядер, чип при необходимости может существенно превышать свой термопакет на время до 25 секунд без повреждения процессора и ущерба для работоспособности.

    В Sandy Bridge используются графические процессоры нового поколения Intel HD Graphics 2000 и HD Graphics 3000, которые могут состоять из шести или двенадцати исполнительных блоков (execution units, EU), в зависимости от модели процессора. Номинальная тактовая частота графики составляет 650 или 850 МГц, при этом она может повышаться до 1100, 1250 или 1350 МГц в режиме Turbo Boost, который теперь распространяется и на видеоускоритель. Графика поддерживает программный интерфейс Direct X 10.1 - разработчики сочли излишней поддержку Direct X 11, справедливо посчитав, что поклонники компьютерных игр, где действительно востребован этот API, в любом случае предпочтут значительно более производительную дискретную графику.

    Маркировка процессоров Sandy Bridge довольно проста и логична. Как и раньше, она состоит из цифровых индексов, которые в некоторых случаях сопровождаются буквенным. Отличить Sandy Bridge от Nehalem можно по названию: индекс новых чипов четырёхзначный и начинается с двойки ("второе поколение"), а старых - трёхзначный. К примеру, перед нами процессор Intel Core i5-2500K. Здесь "Intel Core" означает марку, "i5" - серию, "2" - поколение, "500" - индекс модели, а "K" - буквенный индекс.

    Что касается буквенных индексов, то по чипам с микроархитектурой Nehalem известен один из них это "S" (процессоры i5-750S и i7-860S). Он присваивается чипам, ориентированным на домашние мультимедийные машины. Процессоры с одинаковым числовым индексом отличаются тем, что модели с буквенным индексом "S" работают на чуть меньшей номинальной тактовой частоте, но "турбочастота", достигаемая при автоматическом разгоне Turbo Boost, у них одинакова. Иными словами, в штатном режиме они экономичнее, а их система охлаждения тише, чем у "стандартных" моделей. Все новые десктопные Core второго поколения без индексов потребляют 95 Вт, а с индексом "S" - 65 Вт.

    Модификации с индексом "T" работают на ещё более низкой тактовой частоте, чем "базовые", при этом "турбочастота" у них тоже ниже. Термопакет такие процессоров составляет всего 35 или 45 Вт, что вполне сравнимо с TDP современных мобильных чипов.

    И, наконец, индекс "K" означает разблокированный множитель, что позволяет беспрепятственно разгонять процессор, повышая его тактовую частоту.

    Мы познакомились с общими техническими решениями, реализованными в "настольных" процессорах с архитектурой Sandy Bridge. Далее мы поговорим об особенностях разных серий, изучим актуальный модельный ряд и дадим рекомендации, какие конкретные модели можно считать лучшими покупками в своём классе.