Сайт о телевидении

Сайт о телевидении

» » Процессоры. Увеличение длины конвейера. Тесты. Сравнение с конкурентами

Процессоры. Увеличение длины конвейера. Тесты. Сравнение с конкурентами

Архив Платформа

2 февраля официально увидели свет новые процессоры Pentium 4 на ядре Prescott, принципиально отличающиеся от своих предшественников на ядре Northwood. Что реально мы получаем в настоящий момент с выходом Prescott и стоит ли овчинка выделки?

См. остальные части нашего обзора:
Часть 2.
Часть 3. Быстродействие в играх.
Часть 4. Производительность в ряде профессиональных графических приложений.

Второго февраля, наконец, свершилось то, чего вся компьютерная индустрия с нетерпением ожидала по крайней мере последние полгода - Intel «опрескотилась»! Это означает, что официально увидели свет новые процессоры Pentium 4 на ядре Prescott, принципиально отличающиеся от своих предшественников на ядре Northwood по трем важнейшим категориям: прогрессивные множественные изменения в микроархитектуре процессорного ядра, использование более «тонкого» технологического процесса изготовления кристаллов с нормами 90 нанометров, применение усовершенствованных материалов для изготовления кристалла. Всё вместе это обещает открыть новые горизонты дальнейшего наращивания быстродействия процессоров архитектуры Intel NetBurst. Но обещания - обещаниями, а что реально мы получаем в настоящий момент с выходом Prescott и стоит ли овчинка выделки? Это и предстоит нам выяснить.

Давненько корпорация Intel не радовала нас новыми процессорами для настольных ПК. После феерического выхода целого сонма новых продуктов весной этого года - процессоров Pentium 4 на ядре Northwood с частотами от 2,4 до 3,0 ГГц на системной шине 800 МГц и двухканальных DDR400-чипсетов для них серий i875 и i865 (Canterwood и Springdale), см., например, обзоры на www.terralab.ru/system/25198 , www.terralab.ru/system/25235 , а также www.terralab.ru/system/28979 , последовал лишь еще один процессор в июне - Pentium 4 3,2 ГГц (см. www.terralab.ru/system/25250 ). И затем наступило до неприличия длительное затишье, пару раз нарушенное лишь появлением очередных Celeron. По сути дела, корпорация не объявляла новых Pentium 4 для массового рынка более семи (!) месяцев подряд, что в современных условиях является непростительно долгим сроком.

Конечно, в середине осени Intel провозгласила одну новинку - Pentium 4 Extreme Edition 3,2 ГГц с чудовищными для настольных систем размерами кэш-памяти (2 Мбайт третьего уровня), кристалла и количеством транзисторов (см. www.terralab.ru/system/29365 ). Но и цена этого «экстра-геймерского» процессора оказалась не менее чудовищна по понятиям персональных компьютеров - под тысячу долларов США. А если учитывать, что реально в розничных магазинах эти «монстры» появились лишь совсем недавно и их продажи на фоне обычных Pentium 4 до сих пор ничтожно малы, то Extreme Edition вполне можно отнести не к массовому сегменту, а к своеобразному «процессору ради престижа», не делающему никакой погоды на массовом рынке ПК (по самым оптимистическим прогнозам корпорации доля P4EE среди всех «Пентиумов» не будет превышать пяти процентов). В этой связи, нетерпеливое ожидание Prescott, обладающего мегабайтной кэш-памятью второго уровня, еще более усилилось.

Intel готовила индустрию к выходу Prescott задолго до его появления и делала это величественно и громогласно. Первые сведения просочились в прессу пару лет назад, а в феврале прошлого года на Intel Developer Forum в Сан-Хосе корпорация организовала публичное оглашение основных архитектурных особенностей будущего процессора и подробно рассказала о технологиях и материалах, применяемых для его изготовления (см., например, www.terralab.ru/system/23898 ). А спустя полгода продемонстрировала общественности сами процессоры в работе и показала фотографию кристалла Prescott, обнародовав дополнительные подробности - количество транзисторов, размер чипа и пр. (см. www.terralab.ru/system/29227 ).

Первоначально руководители корпорации уклончиво обещали выпустить процессор осенью 2003 года (неофициально ходили слухи то о сентябре, потом о начале декабря)… Но время текло, «уж полночь близилась», а Германа все не было… За это время основной конкурент Intel на рынке процессоров для ПК - корпорация AMD - успела трижды (!) выпустить свои новые процессоры: сперва в конце сентября вышел долгожданный Athlon 64 3200+ (см. www.terralab.ru/system/29375 ), затем в декабре появился первый недорогой настольный Athlon 64 3000+, отличавшийся от 3200+ только уменьшенной вдвое кэш-памятью второго уровня, и, наконец, в начале января появился великолепный Athlon 64 3400+, который мог не только соперничать на равных с самыми мощными настольными процессорами Intel, но даже нередко превосходил их и своего более дорогого собрата Athlon 64 FX-51 (см. www.terralab.ru/system/31549 ). И это при том, что он работал всего с одним каналом обычной памяти DDR400, тогда как все остальные «топ-модели» требовали для реализации своего скоростного потенциала как минимум двухканального DDR400-решения.

Поклонники Intel с надеждой ожидали явно застопорившегося выхода ядра Prescott, надеясь на чудо - увеличенные вдвое кэш-памяти первого и второго уровня вкупе с другими усовершенствованиями ядра (новые инструкции SSE3, улучшенные HyperThreading, механизм предвыборки и предсказание ветвлений) обещали если не прорыв, то, по крайней мере, существенный рост производительности нового ядра по сравнению со старым. Ранние «оценочные» степпинги Prescott «ходили» по лабораториям и OEM-партнерам Intel начиная с осени, однако особых восторгов от тех, кому с ними удалось «пообщаться», слыхивать не доводилось. А пока руководители корпорации уверяли, что процессор «уже готов» и начиная с четвертого квартала 2003 года «уже идут» его коммерческие поставки производителям, из недр Intel доносились слухи о задержках, связанных с необходимостью «дооптимизировать» технологию производства и ядро самих процессоров с целью получения нужного теплового режима старших моделей и приемлемого для массового производства выхода годных кристаллов.

И поскольку дальше затягивать официальное объявление Prescott было уже неприемлемо, процессоры выпустили 2 февраля. Однако удалось ли производителю при этом в полной мере побороть «детские болезни левизны» нового ядра? Судя по тому дефициту старших моделей Prescott (с частотой 3,2 и 3,4 ГГц), который испытывают сейчас даже ведущие тестовые лаборатории - не совсем удалось. Например, модель 3,40Е не видел живьем еще никто из знакомых мне людей (исключая сотрудников Intel J ), а модель 3,20E пробыла у нас в редакции всего три рабочих дня, поскольку ее как жуткий дефицит «рвали на части» другие «поклонники», и в первые дни после выхода я не обнаружил ни одного предложения модели 3,20E в российских магазинах (не уверен, что они были даже в японских). С другой стороны, подобный «ажиотаж» можно попробовать объяснить и другим - процессор настолько великолепен, что его просто «выметают» из-под прилавков толпы поклонников.

Итак, 2 февраля Intel выпустила сразу семь новых Pentium 4. Их перечень и краткие отличительные особенности приведены в таблице 1.

Процессор

Pentium 4
Extreme Edition
3,40 ГГц

Pentium 4
3,40 ГГц

Pentium 4
3,40E ГГц

Pentium 4
3,20E ГГц

Pentium 4
3,00E ГГц

Pentium 4
2,80E ГГц

Pentium 4
2,80A ГГц

Технология производства

Шина FSB, МГц

Технология Hyper-Threading

Кэш-память второго и третьего уровней

512 кбайт, 2 Mбайт L3

512 кбайт L2

Напряжение питания, В

Разъём (Socket)

Оптовая цена, $

* В официальном документе Intel для этого процессора указано ядро Northwood, но мы то с вами знаем, что Northwood с кэш-памятью третьего уровня называется ядром Gallatin, официально применяемом только в серверных процессорах Intel Xeon, хотя степпинг кристалла Pentium 4 Extreme Edition - фактически тот же самый, что у аналогичных Xeon MP, см. www.terralab.ru/system/29365 .

Если Pentium 4 3,40 ГГц (на ядре Northwood) и Pentium 4 Extreme Edition 3,40 ГГц - это по сути те же, что и раньше, процессоры - теперь с чуть более высокой частотой ядра, то наибольший интерес для нас представляет линейка новичков на ядре Prescott. «Прескотты» внешне почти ничем не отличаются от традиционных Pentium 4 - они размещены в том же корпусе для разъема Socket 478 и лишь иное расположение элементов с обратной стороны корпуса (фото 1) напоминает, что перед нами именно они.

Как видим, все новые процессоры используют системную шину 800 МГц и технологию HyperThreading, кроме самого младшего - «гадкого утенка-прескотёнка», «разжалованного» до шины 533 МГц и лишенного HT. Предположительные объяснения появления такой модели: (а) необходимость продать Prescott ранних степпингов, которые не столь высокочастотны и экономичны, как текущие модификации, (б) необходимость иметь «свой Prescott» для низкостоимостных систем на чипсетах, не поддерживающих шину 800 МГц, (в) лазейку для продажи «отходов» производства более высокочастотных моделей (отбраковка старших моделей). Последнее имеет под собой более жесткие обоснования, чем это было ранее для Northwood. Дело в том, что заметно возросшие токи утечки для ядра Prescott и более высокое тепловыделение в рабочем состоянии (более 100 ватт для старших моделей) накладывает более жесткие требования на тестирование ядер для той или иной частоты/модели. Если процессоры на ядре Northwood (и предшественники) имели близкие друг к другу характеристики зависимости рассеиваемой мощности от частоты работы (с неплохой точностью подчинялись известной для структур КМОП формуле мощности от частоты), то для Prescott имеет место (по крайней мере, на данный момент) гораздо больший разброс характеристик кристаллов даже внутри одной партии и кремниевой пластины. В результате, производитель вынужден выпускать каждый конкретный экземпляр кристалла для строго определенной (по частотным и тепловым характеристикам) модели процессора с весьма небольшими допусками (запасом на отклонение в худшую и лучшую сторону). С этим связан и тот факт, что даже младшие модели Prescott будут весьма неохотно разгоняться (первое время?) - даже небольшое повышение частоты будет вызывать у них очень резкое (гораздо больше, чем у Northwood) повышение тока потребления и температуры, что негативно скажется на стабильности и «живучести» процессора. Это, кстати, подтвердил и побывавший в нашей лаборатории экземпляр - Prescott 3,20E с большим трудом удалось разогнать до 3,4 ГГц, причем работал он при этом нестабильно, выделяя гораздо больше тепла, чем на штатной частоте (не в пример аналогичным Northwood и Extreme Edition, которые подобных проблем не имели). Попутно замечу, что с процессорами Prescott стандартный плавкий термоинтерфейс с обратной стороны боксовых кулеров (фото 2) я настоятельно рекомендую заменять хорошей термопастой.

Краткое сравнение кристаллов трех типов процессоров (Extreme Edition, Northwood и Prescott) представлено в таблице 2. Для сравнения там же приведено текущее ядро процессоров AMD Athlon 64.

Таблица 2. Краткое сравнение кристаллов современных высокопроизводительных процессоров для настольных ПК

Процессор

Intel Pentium 4
Prescott

Intel Pentium 4
Northwood

Intel Pentium 4
Extreme Edition

AMD Athlon 64
ClawHammer

Частоты, ГГц

Технология производства

90 нм,
напряженный кремний

Площадь ядра, кв. мм

Число транзисторов, млн.

Длина целочисленного конвейера

Объем кэш-памяти данных первого уровня

Латентность кэш-памяти первого уровня*

Ассоциативность кэш-памяти первого уровня

Объем кэш-памяти инструкций

12 тыс. микроопераций

12 тыс. микроопераций

12 тыс. микроопераций

Скорость доставки инструкций из кэш-памяти

Объем кэш-памяти второго уровня, кбайт

Латентность кэш-памяти второго уровня*

~30 тактов

~18 тактов

~18 тактов

~12 тактов

Ассоциативность кэш-памяти второго уровня

Объем кэш-памяти третьего уровня

Латентность кэш-памяти третьего уровня*

~45 тактов

Расширение набора инструкций

SSE2/SSE/3Dnow!/ x86-64

Технология HyperThreading

улучшенная

стандартная

стандартная

Напряжение питания, В

Допустимая тепловая мощность, TDP, Вт

* измеренная в программе CPU-Z 1.21.

Количество транзисторов у Prescott увеличилось по сравнения с Northwood более, чем вдвое, но площадь кристалла при этом за счет применения нового техпроцесса даже немного уменьшилась. Вместе с тем, оба они заметно уступают по площади и числу транзисторов ядру Gallatin. Если учесть, что ячейка кэш-памяти требует шести транзисторов (плюс примерно один транзистор в расчете на одну ячейку расходуется для «вспомогательных» нужд - магистральные буферы, мультиплексторы и пр.), и это подтверждают оценки из сравнения ядер Northwood и Gallatin, то получается, что добавление 512 кбайт кэш-памяти второго уровня потребовало лишь около 30 миллионов транзисторов, а «остальные» 40 миллионов ушли на другие архитектурные усовершенствования ядра Prescott. И это - огромное количество, ведь ядро Northwood без кэш-памяти второго уровня содержит всего-то около 25 миллионов «затворов»!


Для наглядности приведу фотографии кристаллов Prescott и Northwood, на которых обозначены те или иные блоки процессора (фото 3 и 4). Подробный анализ расположения и состава каждого из этих блоков провели еще весной прошлого года специалисты сайта «Chip Architect» (подробности см. в статьях на www.chip-architect.net/news/2003_03_06_Looking_at_Intels_Prescott.html и www.chip-architect.com/news/2003_04_20_Looking_at_Intels_Prescott_part2.html ). В частности выяснилось, что многие блоки ядра Prescott существенно избыточны и/или содержат скрытые возможности, среди которых не только достаточно очевидные модули для поддержки технологии La Grande (официально Prescott ее пока не поддерживает) и шины для связи с кэш-памятью третьего уровня (самой памяти L3 на кристалле, естественно, нет), но и вероятно, блоки для реализации технологии Vanderpool и 64-битных вычислений (последнее - пока лишь предположение).

Что же касается официально объявленных нововведений ядра Prescott, то о них мы уже писали почти год назад (см. http://www.terralab.ru/system/23898 ) и с тех пор мало, что поменялось (см. таблицу 2 и рисунок 5).

В-третьих, добавлено 13 новых инструкций (Prescott New Instructions или PNI), улучшающих комплексные расчеты по SSE/SSE2/x87-FP-командам и позволяющих ускорить выполнение мультимедийных и игровых приложений (рисунок 6). По аналогии с предшественницами, эти новые инструкции назвали SSE3, они не требуют специальной поддержки со стороны операционной системы (достаточно поддержки обычных SSE) и полностью совместимы с программным обеспечением, написанным ранее для процессоров Intel. По оценкам корпорации, простая перекомпиляция (уже вышел соответствующий компилятор от Intel) приложений под SSE3 способна поднять быстродействие в среднем на 5% (и до десятков процентов в отдельных задачах). Среди уже оптимизированных для SSE3 приложений - будущая версия Unreal II, многие видеокодировщики (MainConcept, xMPEG, Ligos, Real (RV9), On2 (VP5/VP6), Pegasys TMPGEnc 3.0, Adobe Premier, Pinnacle, Sony DVD Source Creator, Ulead (MediaStudio & Video Studio), Intervideo и другие, использующие кодек DivX 5.1.1.

Несмотря на множество улучшений, в новом ядре применено и несколько вынужденных «ухудшений». Эти «ухудшения» возникли не от хорошей жизни - они фактически являются альтернативным подходом при проектировании и призваны на самом деле улучшить те или иные показатели процессора в расчете на долговременную перспективу и рост частоты ядра процессора. Главным и наиболее критичным для быстродействия процессора изменением стало (как мы и писали еще год назад, см. www.terralab.ru/system/23898 ) увеличение длины основного конвейера - с 20 до 31 такта. Именно это, а не применение новой 90-нанометровой технологии, способно в перспективе позволить поднять тактовую частоту ядра процессора до 5 ГГц и выше.

Вместе с тем, как мы прекрасно помним по переходу с 10-стадийного до 20-стадийный конвейер (от Pentium III на Pentium 4), это может существенно ухудшить быстродействие системы в некоторых задачах, где велик процент неудачных предсказаний переходов. Чтобы снова не наступать на те же грабли, корпорация предприняла ряд шагов по существенному улучшению работы блока предсказания ветвлений и предвыборки данных. Этой же цели (уменьшения потерь производительности за счет удлинения конвейера) служит и вдвое увеличенная кэш-память. Вместе с тем, как показали наши тесты, даже всех этих мер порой оказывается недостаточно для того, чтобы в некоторых неоптимизированных для архитектуры Intel NetBurst приложениях полностью скомпенсировать «вредное» влияние длинного конвейера. С другой стороны, на оптимизированных приложениях при таком подходе прирост производительности окажется ощутимым (вспомним, с каким скрипом Pentium 4 Willamette продвигался на рынок именно из-за отсутствия поначалу оптимизированных для него приложений).

Рисунок 9.

Вторым «ухудшением» стала примерно вдвое возросшая латентность обоих кэшей (см. рисунок 9). Фактически это плата за их возросший объем и «задел» на будущий рост частоты ядра. В некоторых «линейных» задачах это может и не повлиять на быстродействие, но в других может оказаться весьма «болезненным». (Напомним, что длинный конвейер и возросшая латентность кэш-памяти призваны преодолеть трудности с согласованием работы блоков, расположенных в разных частях кристалла и оперирующих с некоторыми задержками друг относительно друга).

Cхемотехника у Prescott существенно изменилась по сравнению с предшественниками, и большинство блоков процессора фактически было спроектировано «с нуля» в тесном сотрудничестве с разработчиками технологии производства кремниевых чипов, чтобы оптимизировать подходы проектирования. Более того, при проектировании топологии кристалла Prescott впервые было применен полностью автоматизированный подход к трассировке и размещению элементов (например, с целью оптимизации задержек и более равномерного распределения тепла по кристаллу), в результате чего элементы блоков не обязательно расположены строго внутри геометрических границ этих блоков, блоки как бы взаимопроникают друг в друга (это видно, например, по размытости фотографии кристалла Prescott), а между блоками и элементами процессора много пустого места, которое удобно для исправления мелких схемотехнических ошибок, дальнейшей оптимизации кристалла и пр.

Рисунок 10.

Первоначально процессоры Prescott будут работать на чипсетах Canterwood и Springdale на системной шине 800 МГц с памятью DDR400 (см. рисунок 10), но позднее для них выйдут чипсеты Alterwood и Grantsdale с поддержкой памяти DDR II, шины PCI Express, южного моста ICH6 и, видимо, системной шины 1066 МГц. Подавляющее большинство уже выпущенных системных плат на чипсетах Intel 875/865, а также последних чипсетах SiS, VIA и ATI будут совместимы с Prescott путем простого обновления BIOS (оно необходимо для правильной инициализации большей кэш-памяти), поскольку эти платы уже разрабатывались с учетом будущих повышенных требований по питанию (старшие Prescott требуют максимальный ток питания 91 ампер). Вместе с тем, разгон «Прескотта» осилит уже далеко не каждая плата - только самые лучшие.

Процессоры на ядре Prescott изготавливаются по новой для Intel 90-нанометровой технологии (это первый 90-нанометровый процессор, вышедший на рынок), причем сразу на 300-миллиметровых подложках. При производстве Prescott применяются ряд новых материалов и технологий микроэлектроники, подробности по которым мы уже не раз описывали (см., например, статьи на www.terralab.ru/system/30717 и www.terralab.ru/system/30845 ). Перечень основных технологических новшеств приведен в таблице 3. Наиболее важной и них является технология «напряженного» (strained, то есть растянутого или сжатого) кремния: деформированная в ту или иную сторону кристаллическая решетка такого кремния обеспечивает большую подвижность электронов или дырок соответственно, а значит, и более высокие частоты работы полевых транзисторов. Для борьбы с утечками транзисторов также были применены специальные меры - технологические и схемотехнические.

Таблица 3. Основные отличия интеловских технологий производства с нормами 130 и 90 нм

130 нанометров

90 нанометров

6 слоёв медных межсоединений

7 слоёв медных межсоединений

Диэлектрик SIOF с низкой диэлектрической проницаемостью

Диэлектрик CDO (легированный кремнием оксид) с низкой диэлектрической проницаемостью

Силицид кобальта как контакт затвора

Силицид никеля как контакт затвора

Ячейка памяти SRAM площадью 2 кв. мкм

Ячейка памяти SRAM площадью 1,15 кв. мкм

248-нанометровая литография

193-нанометровая литография

Обычный кремний

Напряженный кремний

Несмотря на уменьшившуюся площадь ядра, применение новых технологии и новых материалов при производстве Prescott несколько повысило себестоимость кристаллов. Вместе с тем, себестоимость Prescott возросла незначительно, поэтому цена на модели Northwood и Prescott с одинаковой частотой будут одинаковыми. Это позволит избежать неудобных ситуаций на рынке.

Три процессора Pentium 4 с частотой 3,4 ГГц станут, по всей видимости, последними моделями для разъема Socket 478. Это связано с тем, что будущие более высокочастотные Pentium 4, даже изготовленные по более тонкой технологии, будут потреблять существенно большее количество энергии, на которое не рассчитаны существующие нынче и, как правило, приспособленные для Prescott 3,4 ГГц материнские платы. Процессоры 3,6 ГГц и выше потребуют новых спецификаций питания, и чтобы избежать путаницы с системными платами, все они будут выпускаться с разъемом Socket T (известный также как LGA 775). Аббревиатура LGA расшифровывается как Land Grid Array - по аналогии с нынешними Pin Grid Array (PGA) для процессоров или Ball Grid Array (BGA) для чипсетов или микросхем памяти. Конструктив LGA много дешевле, чем PGA или BGA и используется, например, компанией IBM.

У нас в лаборатории побывал экземпляр Pentium 4 3,20E ГГц на ядре Prescott. Безусловно, новая микроархитектура требует весьма пристального подхода для практического изучения, поэтому за те три рабочих дня, что новый процессор был в нашем распоряжении, мы лишь частично смогли постичь его потенциал. В будущем мы планируем еще не раз вернуться к детальному практическому изучению свойств нового ядра от Intel (прежде всего - быстродействия в разнообразных задачах), но уже по первым опытам стало возможным составить первое впечатление от новинки, которое мы и предлагаем вам сейчас.

Подробное описание тестовой конфигурации, участников сравнения и подробный анализ полученных данных вы сможете найти в последующих частях этого обзора на сайте www.terralab.ru , а здесь я подведу лишь предварительные краткие выводы на основе проведенных тестов.

Прежде всего, можно отметить, что у Prescott немного возросла скорость работы с системной памятью по сравнению с Northwood. Причем улучшились не только скорость чтения и полоса пропускания памяти, но и латентность, а также сложные операции (Copy, Scale, Add, Triad). Вместе с тем, на относительно старых приложениях, неоптимизированных под NetBurst, мы наблюдаем существенный проигрыш Prescott своему предшественнику (Northwood) - временами до 15%! Более того, в отдельных задачах Prescott 3,2 ГГц работает даже медленнее, чем Northwood 3,06 ГГц на шине 533 МГц! Вот этого я, признаться, не ожидал. Приложений, в которых Prescott заметно быстрее одночастотного с ним «Нортвуда», как оказалось, пока не так уж много (по крайней мере, в процентном соотношении к общему числу программ). Чаще наблюдается ситуация, когда Prescott немного проигрывает Northwood - этим, например, «грешат» многие современные и недавнего прошлого игры, аудиокодеки, простые математические расчеты. А вот видеокодирование и в некоторые профессиональные трехмерные пакеты моделирования чаще благориятствуют «Прескотту», и его преимущество над Northwood доходит, порой, до 10–15 процентов.

Таким образом, изменения в микроархитектуре NetBurst в процессорах с яром Prescott фактически потребовали новой волны оптимизации приложений. Без такой оптимизации новый процессор часто может работать даже медленнее, чем одинаковый с ним по частоте старый, невзирая на вдвое увеличившуюся кэш-память. На одинаковой частоте Prescott не может (в среднем) соперничать пока с Pentium 4 Extreme Edition. Однако у первого есть ресурсы по заметному наращиванию частоты, в то врем как P4EE и Northwood свои ресурсы практически исчерпали. Хотим мы этого или нет, но будущее Pentium 4 однозначно за Prescott. Хотя на первых порах более выгодным, видимо, будет все же приобретение процессоров на прежнем ядре. Особенно если учесть, что «Прескотты» заметно более горячие в работе, чем аналогичные Northwood и даже Extreme Edition.

Итак, Intel опрескотилась!!!

А хорошо это или плохо - судить вам. Читайте в следующих частях этого обзора:
Часть 2. Простые вычисления, работа кэш-памяти и системной памяти и производительность при работе с видео и аудио.
Часть 3.

Как известно, революции в компьютерном
мире случаются все реже. Да и так ли они необходимы там, где, в общем-то, "все
хорошо", где возможности систем и продуктов с лихвой покрывают нужды большинства
современных пользователей. Это в полной мере относится и к процессорам корпорации
Intel, лидера индустрии. У компании есть полная линейка высокопроизводительных
CPU всех уровней (серверные, десктопные, мобильные), тактовые частоты давно уже
перевалили за "заоблачные" 3 GHz, продажи идут просто "на ура".
И наверное, если бы не оживившиеся конкуренты (точнее, конкурент ), то все
было бы совсем хорошо.

Но "гонка гигагерцев" не прекращается. Оставим в стороне рассмотрение вопросов вроде "Кому это нужно? " и "Насколько это востребовано? " — примем лишь как факт: чтобы удержаться на плаву, производители CPU просто вынуждены тратить силы на выпуск все более быстродействующих (или как минимум более высокочастотных ) продуктов.

Начало февраля Intel отметила представлением целой обоймы новых процессоров. Компания
выпустила сразу семь новых CPU, в числе которых:

  • Pentium 4 3,40 GHz ("старое" ядро Northwood);
  • Pentium 4 Extreme Edition 3,40 GHz;
  • целых четыре представителя новой линейки с ядром Prescott (кстати, ударение
    на первом слоге) — 3,40E, 3,20E, 3,0E и 2,80E GHz, изготовленные по 90-нанометровой
    технологии и оснащенные кэшем второго уровня объемом 1 MB.

Все эти CPU рассчитаны на шину 800 MHz и поддерживают технологию Hyper-Threading. Кроме того, Intel выпустила Pentium 4 на ядре Prescott с частотой 2,8A GHz, также изготовленный по 90-нанометровому процессу, но рассчитанный на частоту FSB 533 MHz и не поддерживающий Hyper-Threading . По информации Intel, предназначен этот процессор специально для OEM-производителей ПК в ответ на их пожелания. От себя добавим — и на радость оверклокерам, которые наверняка оценят его возможности разгона.

С выпуском новых CPU семейство Pentium 4 значительно пополнилось и сейчас выглядит так, как показано в табл. 1. Естественно, пока Intel вовсе не собирается сворачивать производство Pentium 4 на ядре Northwood с FSB 533 и 800 MHz. Кроме того, в линейке остаются и несколько моделей, рассчитанных на шину 400 MHz (пять процессоров от 2A до 2,60 GHz).

Разрабатывая 90-нанометровые технологии, которые должны обеспечить нормальное
функционирование процессоров класса Prescott, инженеры Intel вынуждены
были преодолевать серьезные препятствия. Природа этих преград состояла
не в недостаточном разрешении производственного оборудования, а в проблемах
физического характера, связанных с невозможностью изготовления столь малых
транзисторов по традиционным технологиям.

Первой проявилась утечка заряда с затвора транзистора через истончившийся
слой диэлектрика между затвором и каналом. При разрешении 90 нм он "выродился"
в барьер из четырех атомов SiO2 толщиной 1,2 нм. Появилась необходимость
в новых изолирующих материалах с более высоким значением константы диэлектрической
проницаемости (high-K dielectric). За счет большей проницаемости они позволяют
наращивать толстый (до 3 нм) изолирующий слой, не создавая при этом препятствий
для электрического поля затвора. Таковыми стали оксиды гафния и циркония.
К сожалению, они оказались несовместимы с применяемыми ныне поликристаллическими
затворами, да и фононные колебания, возникающие в диэлектрике, вызывают
снижение подвижности электронов в канале.

На границе с затвором наблюдается иное явление, выражающееся в значительном
повышении порогового уровня напряжения, необходимого для изменения состояния
проводимости канала транзистора. Решение было найдено в виде металлического
затвора. В прошлом году специалисты корпорации подобрали, наконец, два
подходящих металла, которые позволили сконструировать новые миниатюрные
NМOS- и PMOS-транзисторы. Какие именно металлы они использовали — до
сих пор держится в секрете.

Чтобы увеличить быстродействие транзисторов (оно определяется скоростью
перехода в открытое/закрытое состояние), Intel прибегла к формированию
канала из единого кристалла напряженного кремния. "Напряжение"
в данном случае означает деформирование кристаллической решетки материала.
Как оказалось, сквозь структурно нарушенный кремний как электроны (+10%
для NМOS), так и дырки (+25% для PMOS) проходят с меньшим сопротивлением.
Улучшение подвижности увеличивает максимальный ток транзистора в открытом
состоянии.

Для NМOS- и PMOS-транзисторов напряженное состояние достигается различными
методиками. В первом случае все очень просто: обычно транзистор сверху
"укрыт" слоем нитрида кремния, который выполняет функцию предохраняющей
маски, а для создания напряжения в канале толщину слоя нитрида увеличивают
вдвое. Это ведет к созданию дополнительной нагрузки на области истока
и стока и, соответственно, растягивает, деформирует канал.

PMOS-транзисторы "напрягают" по другой схеме. Сначала зоны
истока и стока вытравливают, а потом наращивают в них слой SiGe. Атомы
германия превышают по размерам атомы кремния и поэтому германиевые прослойки
всегда использовались для создания напряжения в кремнии. Однако особенность
технологии Intel заключается в том, что в данном случае сжатие кремниевого
канала происходит в продольном сечении.

Новый технологический процесс также позволил увеличить количество слоев
металлизации с шести до семи (медные соединения). Любопытно, что на производственной
линии "плечом к плечу" трудятся как литографические аппараты
нового поколения с длиной волны 193 нм, так и их предшественники с длиной
волны 248 нм. Вообще процент повторно использованной техники достиг 75,
что позволило снизить стоимость модернизации фабрик.

Особенности Prescott

В дискуссиях, предшествовавших выпуску процессора на ядре Prescott, он в шутку именовался не иначе как "Pentium 5". Собственно, именно таким был типичный ответ компьютерного профи на вопрос "Что такое Prescott?". Конечно, Intel не стала менять торговую марку, да и достаточных оснований для этого не было. Вспомним практику выпуска программного обеспечения — там смена номера версии происходит только при кардинальной переработке продукта, тогда как менее значительные изменения обозначаются дробными номерами версий. В процессорной индустрии дробные номера пока не приняты, и то, что Prescott продолжил линейку Pentium 4, как раз и является отражением того факта, что перемены носят не настолько радикальный характер.

Процессоры на ядре Prescott хоть и содержат немало новшеств и модификаций по сравнению
с Northwood, однако основаны на той же архитектуре NetBurst, имеют ту же корпусировку,
что и предыдущие Pentium 4, устанавливаются в тот же разъем Socket 478 и, в принципе,
должны работать на большинстве материнских плат, поддерживающих 800 MHz FSB и
обеспечивающих должные напряжения питания (естественно, потребуется обновление
BIOS).

Детальное изучение практических вопросов, касающихся Prescott, мы оставим для отдельного материала. А пока попробуем рассмотреть, какие изменения появились в Prescott, и понять, насколько этот процессор отличается от своего предшественника и чего можно в результате ожидать.

Основные новшества, реализованные в ядре Prescott, следующие:

  • Перевод производства кристаллов на техпроцесс 90 нм.
  • Возросшая длина конвейера (с 20 до 31 стадии).
  • Вдвое увеличенные кэши L1 (кэш данных — с 8 до 16 KB) и L2 (с 512 KB до
    1 MB).
  • Изменения в архитектуре:
    -модифицированный блок предсказания переходов;
    -усовершенствованная логика работы L1-кэша (улучшенная предварительная выборка
    данных);
    -появление новых блоков в процессоре;
    -увеличенный объем некоторых буферов.
  • Усовершенствованная технология Hyper-Threading.
  • Появление поддержки нового набора SIMD-инструкций SSE3 (13 новых команд).

Главные различия трех процессорных ядер, использовавшихся в Pentium 4, сведены в табл. 2. Число транзисторов в Prescott увеличилось более чем вдвое — на 70 млн. Из них, по грубым оценкам, порядка 30 млн. можно отнести на счет удвоившегося L2-кэша (дополнительные 512 KB, по 6 транзисторов на одну ячейку). Причем остается еще вполне солидное число, и даже по одному этому значению можно косвенно судить о масштабах произошедших в ядре изменений. Заметим, что, несмотря на такой рост числа элементов, площадь ядра не только не увеличилась, но даже уменьшилась по сравнению с Northwood.

С 90-нанометровым технологическим процессом все, в общем-то, понятно (конечно, на упрощенном, "пользовательском" уровне). Меньший размер транзисторов позволит снизить напряжение питания процессора и уменьшить рассеиваемую им мощность, а следовательно, и нагрев. Это откроет дорогу для дальнейшего увеличения тактовых частот, которое хотя и будет сопровождаться ростом тепловыделения, но "начало отсчета" для этого роста будет уже другим, несколько ниже. Отметим, что с учетом большего числа транзисторов в Prescott по сравнению с Northwood правильнее было бы говорить не об уменьшении, а о сохранении или же меньшем увеличении рассеиваемой мощности.

Удлиненный конвейер . Как видно из табл. 2, по длине конвейера Prescott (31 стадия) более чем наполовину превосходит Northwood. Что за этим кроется, вполне понятно: это не первый случай, когда Intel увеличивает длину конвейера, нацеливаясь на повышение тактовых частот — известно, что чем длиннее конвейер, тем лучше "разгоняется" процессорное ядро. В принципе, сложно сказать однозначно, так ли необходимо такое "удлинение" на текущем этапе, на частотах в районе 3,5 GHz — энтузиасты-оверклокеры разгоняли Pentium 4 (Northwood) и до более высоких значений. Но рано или поздно рост числа стадий оказался бы неизбежен — так почему бы не совместить это событие с выпуском нового ядра?

Увеличенные объемы кэшей и буферов . В принципе, этот пункт напрямую связан с предыдущим. Чтобы обеспечить работой длинный конвейер на высоких частотах, желательно иметь большего объема "подручный склад" в виде кэша для уменьшения количества простоев, при которых процессор ожидает загрузки требуемых данных из памяти. Кроме того, хорошо известно, что при прочих равных из двух процессоров с разной длиной конвейера производительнее окажется тот, у которого этот параметр меньше. При ошибках предсказания перехода процессор вынужден "сбрасывать" свой конвейер и загружать его работой по-новому. И чем большее число стадий в нем содержится, тем болезненнее оказываются подобные промахи. Полностью их исключить, конечно же, нельзя, и на одинаковых частотах Northwood и Prescott последний оказался бы менее производительным… не будь у него большего L2-кэша, во многом компенсирующего отставание. Естественно, здесь все зависит от специфики конкретных приложений, что мы и попытаемся проверить в практической части.

Как говорилось выше, в Prescott увеличен не только общий L2-кэш, но и L1-кэш данных, объем которого вырос с 8 до 16 KB. Также изменились его организация и часть логики работы — к примеру, введен механизм принудительного продвижения (force forwarding ), уменьшающий задержки в случаях, когда зависимая операция загрузки данных из кэша не может спекулятивно выполняться до завершения предшествующей операции помещения этих данных в кэш.

Кроме объемов кэшей, увеличению подверглась и емкость двух планировщиков, отвечающих за хранение микроопераций (uops ), которые используются в инструкциях x87/SSE/SSE2/SSE3. Это, в частности, позволило более эффективно находить параллелизм в мультимедиаалгоритмах и выполнять их с лучшей производительностью.

Собственно, некоторых новшеств в архитектуре Pentium 4, реализованных в Prescott, мы уже успели коснуться, поскольку они "разбросаны" по ядру процессора и затрагивают многие его блоки. Следующим важным изменением является…


Модифицированный блок предсказания переходов . Как известно, точность
работы этого блока является критически важной для обеспечения высокой производительности
современного процессора. "Просматривая" программный код, следующий за
выполняемым в настоящий момент, процессор может заранее выполнять части
данного кода — это хорошо известное спекулятивное выполнение . Если же
в программе встречается ветвление в результате условного перехода (если-то-иначе ),
то возникает вопрос о том, какую из двух веток "лучше" выполнять заранее.
Алгоритмы в Northwood действовали относительно просто: переходы назад предполагались
совершающимися, вперед — нет. Это большей частью работало для циклов,
но не для других видов переходов. В Prescott используется понятие длины
перехода : исследования показали, что если дальность перехода превышает
определенный предел, то переход с большой долей вероятности совершаться не будет
(соответственно, спекулятивно выполнять эту часть кода не нужно). Также в Prescott
введен более тщательный анализ самих условий перехода, на основании которого принимаются
решения о вероятности выполнения перехода. Кроме статических алгоритмов предсказания,
изменениям подверглись и динамические алгоритмы (кстати, новые идеи были частично
заимствованы из мобильного Pentium M).

Появление новых блоков в процессоре . Два новых блока в Prescott — это блок побитовых сдвигов и циклических сдвигов (shifter/rotator) и выделенный блок целочисленного умножения . Первый позволяет осуществлять наиболее типичные операции сдвига на одном из двух быстрых ALU, работающих на удвоенной частоте ядра CPU (в предыдущих модификациях Pentium 4 эти операции выполнялись как целочисленные и занимали несколько тактов). Для осуществления целочисленного умножения ранее задействовались ресурсы FPU, что достаточно долго — нужно было передать данные в FPU, выполнить там сравнительно медленное умножение и передать результат обратно. В Prescott для ускорения этих операций добавлен новый блок, отвечающий за такие операции умножения.

Улучшенный Hyper-Threading . Конечно, все перечисленные выше новшества введены в Prescott неспроста. По словам специалистов Intel, большинство модификаций в логике работы кэшей, очереди команд и пр. так или иначе связаны с быстродействием процессора при использовании Hyper-Threading, т. е. при одновременной работе нескольких программных потоков. В то же время на производительность "однопоточных" (single-threaded) приложений эти нововведения оказывают лишь незначительное влияние. Также в Prescott увеличился набор инструкций, которым "позволено" исполняться на процессоре параллельно (например, операция с таблицей страниц и операция с памятью, разбивающая строку кэша). Опять-таки, для однопоточных приложений невозможность совмещения подобных операций практически не сказывалась на производительности, тогда как при выполнении двух потоков такое ограничение зачастую становилось "узким местом". Другой пример — если в Northwood происходило "непопадание в кэш" (cache miss) и возникала необходимость чтения данных из оперативной памяти, следующие операции просмотра кэша откладывались до окончания этого действия. В результате одно приложение, часто "промахивающееся" мимо кэша, могло существенно затормозить работу остальных потоков. В Prescott этот конфликт легко преодолевается, операции могут выполняться параллельно. Также в Prescott была переделана логика арбитража и разделения ресурсов между потоками с целью увеличения общей производительности.

Инструкции SSE3. Как мы помним, последний раз расширение набора SIMD-инструкций
Intel провела, выпустив первый Pentium 4 (Willamette) и реализовав в нем SSE2.
Очередное расширение, получившее название SSE3 и содержащее 13 новых инструкций,
осуществлено в Prescott. Все они, за исключением трех, используют SSE-регистры
и предназначены для повышения производительности в следующих областях:

  • быстрое преобразование вещественного числа в целое (fisttp );
  • сложные арифметические вычисления (addsubps, addsubpd, movsldup, movshdup,
    movddup
    );
  • кодирование видео (lddqu );
  • обработка графики (haddps, hsubps, haddpd, hsubpd );
  • синхронизация потоков (monitor, mwait ).

Естественно, детальное рассмотрение всех новых инструкций выходит за рамки материала, эта информация приведена в соответствующем руководстве для программистов. Инструкции первых четырех категорий служат как для ускорения выполнения самих операций, так и для того, чтобы сделать их более "экономными" в смысле использования ресурсов процессора (и, следовательно, оптимизации работы Hyper-Threading и механизма спекулятивного выполнения). Программный код при этом также значительно сокращается и, что немаловажно, упрощается. Например, инструкция ускоренного преобразования вещественного числа в целое fisttp заменяет семь (!) команд традиционного кода. Даже по сравнению с инструкциями SSE2 (которые сами по себе также ускоряют выполнение кода и сокращают его объем) команды SSE3 во многих случаях дают немалую экономию. Две инструкции последней группы — monitor и mwait — позволяют приложению (точнее потоку ) сообщать процессору, что в данный момент оно не выполняет полезной работы и находится в режиме ожидания (например, записи в определенную ячейку памяти, возникновения прерывания или исключительной ситуации). Процессор при этом может переводиться в режим пониженного энергопотребления или же, при использовании Hyper-Threading, отдавать все ресурсы другому потоку. В общем, с SSE3 для программистов открываются новые возможности по оптимизации кода. Проблема здесь, как всегда в таких случаях, одна: пока новый набор инструкций не стал общепринятым стандартом, разработчикам ПО придется поддерживать две ветки кода (с SSE3 и без оной), чтобы приложения работали на всех процессорах…

Камо грядеши?..

В общем, объем новшеств, реализованных в ядре Prescott, вполне можно назвать
значительным. И хотя до "настоящего Pentium 5" он недотягивает, но к
"четырем с половиной" вполне может приблизиться. Переход от ядра Northwood
к Prescott — в принципе, эволюционный процесс, хорошо укладывающийся в общую
стратегию Intel. Постепенные изменения в архитектуре Pentium 4 хорошо видны на
схеме: архитектура модифицируется и пополняется новыми особенностями — идет последовательная
оптимизация процессора под определенный набор ПО.

Чего же можно ожидать от Prescott? Пожалуй, прежде всего (хотя это может показаться и несколько странным) — новых частот. Intel сама признает, что на равных частотах производительность Prescott и Northwood будет мало отличаться. Положительное влияние большого L2-кэша и прочих новшеств Prescott во многом "компенсируется" его значительно более длинным конвейером, который болезненно реагирует на ошибки предсказания переходов. И даже с учетом того, что блок этого самого предсказателя переходов был усовершенствован, все равно идеальным он быть не может. Главное преимущество Prescott в другом: новое ядро позволит дальше наращивать частоту — до значений, недостижимых ранее с Northwood. По планам Intel ядро Prescott рассчитано на два года, пока его не сменит следующее ядро, изготовленное по технологии 65 нм (0,065 мкм).

Поэтому выпущенный сейчас процессор на новом ядре Prescott не претендует прямо со старта на лавры чемпиона производительности и во всей красе должен проявить себя в будущем. Еще одним подтверждением тому является и позиционирование процессора: Pentium 4 на ядре Prescott рассчитан на mainstream-системы, в то время как топовым CPU был и остается Pentium 4 Extreme Edition. Кстати, хотя планка частот у процессоров Intel номинально поднялась до 3,4 GHz с выходом Prescott, но появление первых OEM-систем на базе Pentium 4 3,4 GHz на новом ядре произойдет несколько позднее в этом квартале (а ведь коммерческие поставки Prescott начаты еще в IV квартале 2003 г.).

Еще одна область, где может проявить себя Prescott (и наверняка проявит), — это работа ПО, оптимизированного под SSE3. Процесс оптимизации уже начался, и на сегодня существует как минимум пять приложений с поддержкой нового набора инструкций: MainConcept (MPEG-2/4), xMPEG, Ligos (MPEG-2/4), Real (RV9), On2 (VP5/VP6). В течение 2004 г. поддержка SSE3 должна появиться в таких пакетах, как Adobe Premiere, Pinnacle MPEG Encoder, Sony DVD Source Creator, Ulead MediaStudio и VideoStudio, всевозможные аудио- и видеокодеки и т. д. Вспоминая процесс оптимизации под SSE/SSE2, можно понять, что результаты SSE3 мы увидим, но отнюдь не сразу — опять-таки, это в определенном смысле "задел на будущее".

Ну а что же "по ту сторону линии фронта"? Главный конкурент Intel по-прежнему идет своим путем, все дальше отдаляясь от "генеральной линии". AMD продолжает наращивать "голую производительность", пока что обходясь значительно более низкими частотами. Контроллер памяти, в Athlon 64 перекочевавший из северного моста в процессор, подлил масла в огонь, обеспечив невиданную ранее скорость доступа к ОЗУ. А недавно был выпущен процессор с рейтингом 3400+ (нет, о полном соответствии продукту конкурентов по частоте никто не говорит…).

Однако Intel и AMD сейчас находятся примерно в равных ситуациях — их топовые процессоры ожидают выхода соответствующего оптимизированного ПО, чтобы проявить себя на полную мощность. Intel все больше "уходит в мультимедиа": для офисного ПО производительности Pentium 4 хватает с лихвой, и чтобы Prescott реализовал свой потенциал, нужны оптимизированные мультимедиаприложения (и/или высокие тактовые частоты, в возможности достижения которых можно не сомневаться). Стоит отметить тот факт, что переработка кодеков под SSE3 — пожалуй, не самая сложная операция, а эффект от этого сразу почувствуют все приложения, использующие такие кодеки (причем переработка самих приложений при этом совсем необязательна).

С другой стороны, в середине 2004 г. выйдет 64-разрядная версия Windows для платформы AMD64, на которой как раз и должны проявиться возможности Athlon 64. Конечно, здесь встанет обычный вопрос о наборе приложений под новую ОС, без которых система остается практически бесполезной. Но вспомним, что уже как минимум существуют те же кодеки, откомпилированные под 64-битные Athlon. Так что есть вероятность того, что в недалеком будущем и платформе AMD будет где себя показать. В общем, создается впечатление, что пока титаны просто накачивают мускулы, строят оборонительные сооружения и готовят тылы перед главным… нет, скорее, очередным сражением…

ВведениеЕщё в прошлом году компания Intel говорила о грядущей смене приоритетов в создании новых процессоров. Ввиду возникших трудностей на пути наращивания тактовых частот процессоров Pentium 4, компания решила сосредоточить основные усилия не на увеличении их производительности, а на расширении функциональности. В течение прошлого года были сделаны первые подвижки в этом направлении: например, CPU стали маркироваться при помощи процессорного рейтинга, а тактовая частота в маркировке была отодвинута на второй план. Однако, реальные шаги, направленные на придание процессорам новых функций, были запланированы на этот, 2005 год. Поэтому, первых в этом году анонсов процессоров мы ждали с особым нетерпением.
И вот, свершилось. Сегодня компания Intel представляет на суд потребителей новые процессоры в семействе Pentium 4, в основе которых лежит обновлённое ядро, известное под кодовым именем Prescott 2M. Хотя, взятый Intel курс на внедрение в настольные системы двуядерных процессоров пока никак не отразился в новинках, новые Pentium 4, обладающие рейтингами вида 6XX, наделены рядом новых и интересных возможностей. Именно поэтому процессоры Pentium 4 6XX на базе ядра Prescott 2M и являются столь интересными объектами для изучения: в этих CPU мы сталкиваемся с увеличенной кеш-памятью второго уровня и с новыми для сектора настольных компьютеров технологиями Enhanced Memory 64 Technology и Enhanced Intel SpeedStep.
Параллельно с линейкой Pentium 4 6XX Intel выводит на рынок и ещё один процессор, нацеленный на энтузиастов. Этот CPU, входящий в семейство Pentium 4 Extreme Edition, в отличие от линейки Pentium 4 6XX, призван поднять планку производительности и стать наиболее быстрым CPU от Intel на сегодняшний день. А потому, новый Pentium 4 Extreme Edition, хотя и лишён некоторой функциональности Pentium 4 6XX, имеет большую тактовую частоту и работает при более высокой частоте шины.
Впрочем, подходить к новым продуктам Intel можно и с другой стороны. На фоне несомненных успехов основного конкурента, компании AMD, процессоры Pentium 4 смотрелись до сегодняшнего дня не лучшим образом. Старшие модели Athlon 64 превосходили аналогичные продукты Intel как по быстродействию, так и по поддерживаемым функциям. Теперь же, очевидно, Intel предпринимает очередную попытку настичь конкурента. Увеличение кеш-памяти второго уровня в процессорах на новом ядре Prescott 2M имеет под собой цель поднять их производительность. А внедрение в Pentium 4 6XX новых технологий Enhanced Memory 64 Technology и Enhanced Intel SpeedStep можно рассматривать как ответ Intel на имеющиеся в процессорах Athlon 64 технологии AMD64 и Cool"n"Quiet.
В данном обзоре мы попробуем оценить новинки от Intel со всех сторон. Мы посмотрим как на то, какие новые возможности способны привнести новые технологии, появившееся в процессорах с ядром Prescott 2M, так и на то, насколько изменилась производительность новых CPU семейств Pentium 4 6XX и Pentium 4 Extreme Edition, и смогут ли они составить достойную конкуренцию старшим моделям процессоров Athlon 64 и Athlon 64 FX. Однако, по традиции, практическое исследование новинок предваряет небольшая теоретическая часть.

Новые процессоры Pentium 4 6XX и Pentium 4 Extreme Edition 3.73 ГГц

Итак, сегодня, 20 февраля 2005 года компания Intel официально объявила новые процессоры Pentium 4 Extreme Edition 3.73 ГГц и Pentium 4 серии 6XX. Все эти процессоры основываются на одном и том же процессорном ядре Prescott 2M, основным отличительным признаком является увеличенная кеш-память второго уровня, которая имеет объём 2 Мбайта. В остальном же, включая и 90 нм технологический процесс с использованием растянутого кремния, ядро Prescott 2M подобно своему предшественнику, ядру Prescott, которое уже давно используется в процессорах Pentium 4 серии 5XX.
Сходство между Prescott и Prescott 2M видно даже на фотографиях этих ядер:

PrescottPrescott 2M


Как видим, кеш память у Prescott 2M действительно стала в два раза больше. В остальном, видимых отличий между ядрами не наблюдается.
Семейство процессоров Pentium 4 6XX состоит на сегодняшний день из нескольких моделей с частотами от 3.0 до 3.6 ГГц. Все эти процессоры, как и их предшественники, используют шину Quad Pumped Bus с частотой 800 МГц. Младшая модель имеет процессорный номер 630, модель с частотой 3.2 ГГц – 640, 3.4-гигагерцовый процессор – 650 и CPU с частотой 3.6 ГГц – 660. Следует заметить, что частота старшего процессора в линейке "шестисотых", Pentium 4 660, меньше частоты старшего процессора на базе обычного ядра Prescott, Pentium 4 570, составляющей 3.8 ГГц. Однако при этом Pentium 4 6XX имеют по сравнению со своими младшими братьями ряд преимуществ.
Во-первых, процессоры семейства Pentium 4 6XX поддерживают технологию Enhanced Memory 64 Technology (EM64T) – 64-битные расширения архитектуры x86, являющиеся аналогом расширений AMD64. Благодаря этому все процессоры Pentium 4 6XX совместимы с операционной системой Windows XP Professional x64 Edition, которой немногим ранее мы посвятили отдельную статью . Благодаря совместимости с этой операционной системой, Pentium 4 6XX теперь могут похвастаться целым рядом преимуществ, знакомым нам по процессорам Athlon 64. В числе оных в первую очередь следует отметить одновременную совместимость с 32-битным и 64-битным программным обеспечением, а также поддержку объёмов памяти, превышающих 4 Гбайта.
Второй плюс процессоров Pentium 4 6XX - это поддержка ими технологии Enhanced Intel SpeedStep (EIST). Данная технология является полным аналогом аналогичного механизма, реализованного в мобильных процессорах Intel. Суть данного механизма заключается в том, что процессоры Pentium 4 6XX могут снижать свою частоту в моменты, когда от них не требуется высокая производительность. При помощи данного метода достигается существенное снижение тепловыделения и энергопотребления.
При этом все CPU семейства Pentium 4 6XX поддерживают технологию Execute Disable Bit (XD bit), появившуюся в Pentium 4 5XX с выходом старшей модели с частотой 3.8 ГГц и процессорным номером 570.
Таким образом, несмотря на свою более низкую тактовую частоту, процессоры Pentium 4 семейства 6XX по числу поддерживаемых функций превосходят своих предшественников, Pentium 4 5XX.
Следует напомнить, что Intel отказался от выпуска процессоров на базе ядра Prescott с частотами 4 ГГц и выше. Это относится и к CPU, в основе которых лежит ядро Prescott 2M. То есть, старшая модель в линейке 5XX, Pentium 4 570 с частотой 3.8 ГГц так и останется самой быстрой моделью CPU на базе ядра Prescott. В линейке же 6XX на сегодня старшая модель процессора с номером 660 имеет частоту 3.6 ГГц. Соответственно, более быстрые процессоры в этом семействе появляться могут. Так, во втором квартале текущего года Intel собирается объявить Pentium 4 670 с тактовой частотой 3.8 ГГц.
Впрочем, вопрос относительно того, какой из процессоров Intel является самым быстрым на сегодняшний день, решается не в пользу ни Pentium 4 660, не в пользу Pentium 4 570. На эту роль претендует ещё один процессор на базе ядра Prescott 2M, анонсированный сегодня и отнесённый к семейству Pentium 4 Extreme Edition. Данная новинка обладает тактовой частотой 3.73 ГГц и рассчитана на работу при частоте шины 1066 МГц. При этом, хотя большинство характеристик Pentium 4 Extreme Edition 3.73 ГГц повторяет характеристики серии Pentium 4 6XX, этот процессор не поддерживает технологию EIST. Технологии же XD bit и EM64T в этом CPU включены.
А вот какую информацию выдаёт о новых процессорах Pentium 4 Extreme Edition 3.73 ГГц и Pentium 4 660 диагностическая утилита CPU-Z:


Intel Pentium 4 660


Intel Pentium 4 Extreme Edition 3.73 ГГц


Подводя итог, приведём формальные характеристики анонсированных сегодня процессоров Pentium 4 6XX и Pentium 4 Extreme Edition. В таблице ниже для сравнения также приведены характеристики процессоров Pentium 4 5XX.


Что касается теплового пакета новых процессоров, то их тепловыделение укладывается в те же самые рамки, что и у процессоров серии 5XX. Соответственно Pentium 4 6XX c частотами до 3.4 ГГц включительно вписываются в TDP в 84 Вт, старшие же модели, а также новый Pentium 4 Extreme Edition 3.73 ГГц имеют TDP в 115 Вт.
Таким образом, новые процессоры могут использоваться в тех же самых материнских платах, что и предшествующие LGA775 Pentium 4. Единственное требование: поддержка новых CPU со стороны BIOS материнской платы.
А вот как выглядят новые процессоры:






Слева-направо: Pentium 4 570, Pentium 4 660,
Pentium 4 Extreme Edition 3.73 ГГц

Ядро Prescott 2M: изменения в кеш-памяти

Так как одним из основных нововведений, произошедших с процессорами Pentium 4 при их переводе на использование нового ядра Prescott 2M, стало увеличение кеш-памяти второго уровня, следует уделить немного внимания организации L2 кеш-памяти в новом ядре. Чтобы понять, как же устроена кеш-память второго уровня в новом ядре Prescott 2M, мы вновь воспользовались диагностической утилитой CPU-Z. Для сравнения, мы приводим и аналогичную информацию, относящуюся к более старому ядру, Prescott:

Как видим, у Prescott 2M и Prescott кеш-память второго уровня (да и первого тоже) организована совершенно одинаково. Различие только в размере. Кеш второго уровня у обоих ядер имеет 8 зон ассоциативности и оперирует строками длиной 64 байт. Однако наличие одинакового количества зон ассоциативности у кеш-памяти разного объёма автоматически означает, что поиск данных в более ёмком кеше должен выполняться дольше. Соответственно, L2 кеш процессоров на базе ядра Prescott 2M должен быть более медленным, чем L2 кеш процессоров, в основе которых лежит обычное ядро Prescott.
Чтобы проверить эту гипотезу, мы вооружились утилитой Cache Burst 32. Тестовая система, на которой мы проводили измерения, основывалась на материнской плате Intel Desktop Board D925XECV2 на чипсете i925XE Express и была снабжена двухканальной DDR2-533 SDRAM с таймингами 4-4-4-11. Для опытов мы использовали процессоры Pentium 4 560 и Pentium 4 660 на ядрах Prescott и Prescott 2M соответственно.












Как показывают результаты теста, действительно, скорость чтения из кеш-памяти второго уровня у нового процессора Pentium 4 660 ниже, чем у аналогичного Pentium 4 560 с меньшим объёмом кеш-памяти. При этом скорость записи и латентность кешей у этих CPU совпадает. Однако при копировании данных мы видим, что кеш-память процессора на ядре Prescott 2M работает несколько быстрее, чем кеш-память CPU с ядром Prescott.
Таким образом, мы вынуждены констатировать, что увеличение кеш-памяти второго уровня у процессоров Pentium 4 6XX повлекло за собой и некоторые глубинные изменения, в результате которых скорость работы с данными в L2 кеше изменилась. Причём, не в лучшую сторону. Отметим, что подобное же явление уже один раз происходило с NetBurst архитектурой при переходе от ядра Northwood к ядру Prescott. Так что мы вновь должны заметить, что увеличение объёма кеш-памяти второго уровня не лучшим образом отражается на её быстродействии.

Подробности о Demand Based Switching

С вводом в процессорах Pentium 4 6XX технологии Enhanced Intel SpeedStep (EIST) эти процессоры стали обладателями сразу трёх технологий, попадающих под собирательное название Demand Based Switching (переключение по потребностям). Первые две технологии мы уже рассматривали, обзирая процессор Pentium 4 570J, который был основан на ядре Prescott степпинга E0. С появлением этого степпинга ядра процессоры Pentium 4 получили в свое распоряжение новый механизм термального мониторинга TM2 и новый режим для снижения энергопотребления C1E. EIST дополнила эти технологии в новом ядре Prescott 2M и теперь новые процессоры Pentium 4 6XX могут похвастать ещё более низким средневзвешенным энергопотреблением и тепловыделением.
Технология EIST предназначается для управления частотой процессора и его напряжением в зависимости от степени загрузки, как это делается в мобильных компьютерах. В настольном сегменте аналогом EIST является технология Cool"n"Quiet от AMD, реализованная в процессорах семейства Athlon 64. Можно сказать, что EIST позволяет более рационально использовать ресурсы процессора: при работе в приложениях, не загружающих процессор на 100% его максимальная тактовая частота никому не нужна, в такие моменты её можно спокойно снизить, параллельно уменьшив тепловыделение и энергопотребление CPU. Если же приложение требует от процессора максимальной производительности, то он увеличит частоту до номинальной отметки, попутно подняв напряжение на ядре до нужной величины.
Включается технология EIST абсолютно также, как и Cool"n"Quiet. В Windows XP, например, на закладке Power Option Properties необходимо изменить схему питания компьютера со стандартной Home/Office Desk на Minimal Power Management. После этой установки процессор начнёт снижать свою частоту в моменты низкой загрузки. Необходимый для работы этой технологии процессорный драйвер входит в Service Pack 2, поэтому технология EIST становится совместимой с Windows XP после установки SP2.
На первый взгляд, EIST не вызывает никаких вопросов, однако эта достаточно интересная технология таит в себе и немало сюрпризов. Дело в том, что все три технологии семейства Demand Based Switching, C1E, TM2 и EIST используют один и тот же механизм. Именно поэтому мы решили ещё раз вернуться к рассказу о том, как же на самом деле работают эти технологии.
Функционирование C1E, TM2 и EIST основано на том факте, что процессоры Pentium 4 с ядром Prescott, начиная со степпинга E0, умеют изменять свой коэффициент умножения и Vid "на лету". Конкретнее, процессоры с ядрами Prescott и Prescott 2M при необходимости могут снижать свой множитель до 14x (а это – минимальное значение для ядра Prescott), уменьшая при этом своё напряжение питания примерно на 0.25В. Сочетание этих характеристик и определяет повсеместно эксплуатируемый "режим пониженного энергопотребления", при котором процессор работает на частоте 2.8 ГГц со сниженным напряжением питания. Вот, например, какую информацию выдаёт утилита CPU-Z про процессор Pentium 4 660 (штатная частота 3.6 ГГц), находящийся в этом "режиме пониженного энергопотребления":


Ещё одна интересная деталь заключается в том, что для всех процессоров серии Pentium 4 6XX с разными тактовыми частотами режим пониженного энергопотребления одинаков: все они в этом режиме работают на частоте 2.8 ГГц вне зависимости от их номинальной частоты.
Важно заметить, что для обеспечения стабильности работы переход в этот режим и выход из него происходит не скачкообразно, а постепенно. Так, при входе в "режим пониженного энергопотребления" процессор сначала понижает свой множитель до 14x, а лишь потом постепенно снижет напряжение питания. Выход из этого режима происходит в обратном порядке: сначала постепенно увеличивается напряжение, а только потом устанавливается штатный множитель.


Все три технологии из серии Demand Based Switching, C1E, TM2 и EIST, используют этот режим пониженного энергопотребления. Различие же между C1E, TM2 и EIST заключается лишь в том, в какие моменты включается данный режим.
Технология C1E (Enhanced Halt State) активизирует режим пониженного энергопотребления при поступлении на процессор команды Halt, говорящей о переводе процессора в режим ожидания. Эта команда отдаётся процессору операционной системой в моменты, когда для исполнения нет никаких других инструкций. То есть, если ранее процессоры Pentium 4 при поступлении команды Halt просто переводили часть своих исполнительных устройств в режим бездействия, режим C1E позволяет ещё сильнее снизить тепловыделение и энергопотребление благодаря дополнительному уменьшению тактовой частоты, на которой работает активная часть CPU в режиме ожидания.
Технология TM2 (Thermal Monitor 2) , хотя и предназначается для защиты процессора от перегрева, использует тот же самый 2.8-гигагерцовый режим пониженного энергопотребления. TM2 переводит CPU в этот режим по команде, поступающей от встроенного в ядро процессора термодатчика. Если температура процессора превышает некоторое предельно допустимое значение температуры (а это значение калибруется индивидуально для каждого экземпляра CPU), частота процессора снижается до 2.8 ГГц и одновременно понижается напряжение питания процессорного ядра. Этот механизм позволяет снизить температуру процессора до допустимых пределов примерно на 40% быстрее, нежели при используемом раньше механизме TM1, основанном на модуляции несущей частоты.
Технология EIST (Enhanced Intel SpeedStep) , как это не покажется странным, также переводит процессор в 2.8-гигагерцовый режим пониженного энергопотребления. В рамках этой технологии переход в данное состояние инициируется операционной системой. Если драйвер процессора рапортует о низкой загрузке CPU в конкретный момент времени, операционная система через соответствующую команду ACPI переводит процессор в режим пониженного энергопотребления. То есть, благодаря EIST удаётся снизить тепловыделение процессора не только в моменты его полного простоя, но и при небольшой загрузке.
Теперь о неприятном. Поскольку минимально возможным коэффициентом умножения для процессоров на базе ядра Prescott (и его производной Prescott 2M) является 14x, использование технологий C1E, TM2 и EIST возможно только для CPU, имеющих больший множитель. Например, именно поэтому новым процессором Pentium 4 Extreme Edition 3.73 ГГц технологии C1E, TM2 и EIST не поддерживаются: штатный множитель этого CPU равен 14x. Соответственно, чем выше штатный множитель у процессора, тем больший эффект способны принести технологии семейства Demand Based Switching.

Температурный режим и энергопотребление

После того, как мы разобрались, какие новые технологии для снижения энергопотребления применил Intel в своих процессорах семейства Pentium 4 6XX, самое время посмотреть, как они проявляются на практике. Поэтому, мы изучили температурный режим и энергопотребление новых процессоров во время их реальной работы.
Для целей тестирования мы собрали тестовую систему, состоящую из следующего набора комплектующих:


Память: 1024MB DDR2-533 SDRAM (OCZ PC2 4300, 2 x 512MB, 4-4-4-11);


В первую очередь в этой тестовой системе мы провели измерение температурного режима LGA775 процессоров Pentium 4 6XX и Pentium 4 5XX. В качестве процессоров линейки Pentium 4 5XX использовались CPU, в основе которых лежат ядра Prescott степпинга E0, то есть поддерживающие C1E и TM2. Pentium 6XX были представлены процессорами с ядром Prescott 2M степпинга N0, эти CPU поддерживали C1E, TM2 и EIST. Частоты испытуемых процессоров устанавливались в 2.8, 3.0, 3.2, 3.4, 3.6 ГГц, а для процессора на ядре Prescott со степпингом ядра E0 – и в 3.8 ГГц. Частота шины во всех случаях была номинальной, напряжение питания ядра – тоже. Во всех опытах использовался штатный боксовый LGA775 кулер. Показания температуры процессоров снимались с встроенного в ядро CPU датчика. Измерения температуры процессорных ядер мы выполняли в двух состояниях: в режиме ожидания (idle) и при максимальной загрузке CPU, создаваемой специальной утилитой S&M версии 0.3.2, являющейся на сегодняшний день лучшим инструментом для прогрева процессоров.
Помимо результатов измерений температур Pentium 4 "пятисотой" и "шестисотой" серий, на итоговые графики мы добавили и данные, полученные при испытании процессора Pentium 4 Extreme Edition 3.73 ГГц. Хотя этот процессор и основывается на том же самом ядре Prescott 2M степпинга N0, как и все Pentium 4 6XX, он не поддерживает технологии C1E, TM2 и EIST. Поэтому, его температурный режим и энергопотребление вызывает особый интерес.






Как видим, при максимальной нагрузке на процессоры Pentium 4 5XX и Pentium 4 6XX они прогреваются примерно до одинаковой температуры при равной тактовой частоте. То есть, увеличение кеш-памяти второго уровня не привело к какому сколько-нибудь заметному изменению температурной картины. Зато работа процессоров в состоянии покоя заслуживает определённого внимания. В первую очередь заметим, что вне зависимости от частоты Pentium 4 5XX и Pentium 4 6XX показывают совершенно одинаковую температуру. Это объясняется тем, что в состоянии бездействия эти процессоры, фактически, работают в "состоянии пониженного энергопотребления" на частоте 2.8 ГГц, независимо от их номинальной частоты. Например, Pentium 4 XE 3.73 ГГц, который технологии C1E, TM2 и EIST не поддерживает, в состоянии покоя прогревается гораздо сильнее. Это неудивительно: в этом состоянии, в отличие от процессоров Pentium 4 5XX и 6XX, он продолжает работать на своей штатной частоте.
Также, помимо температуры, мы оценили и энергопотребление процессоров с ядрами Prescott и Prescott 2M. Для этого при помощи токовых клещей мы измерили ток, проходящий по 12-вольтовой цепи, по которой осуществляется питание процессора. То есть, приводимые ниже данные не учитывают КПД конвертера питания процессора, поэтому, по сравнению с реальным энергопотреблением процессоров они слегка завышены (примерно на 10%).






Качественно картина получается такая же, как и при измерении температуры. Однако мы должны отметить, что новые процессоры на базе ядра Prescott 2M, несмотря на увеличившееся количество транзисторов, обладают более низким энергопотреблением, чем процессоры на базе обычного ядра Prescott. Таким образом, резервы для наращивания тактовых частот процессоров Pentium 4 6XX ещё есть.

Разгон

Чтобы оценить эти резервы, а также понять, насколько новое процессорное ядро Prescott 2M степпинга N0 может понравиться энтузиастам-оверклокерам, мы решили провести испытания CPU Intel Pentium 4 660 со штатной частотой 3.6 ГГц на разгон. Тестовая система, используемая в этом случае, была составлена из следующего набора комплектующих:

Процессор: Intel Pentium 4 660 (3.6 ГГц);
Материнская плата: ASUS P5AD2-E Premium (LGA775, i925XE Express);
Память: 1024MB DDR2-667 SDRAM (Corsair XMS2-5300, 2 x 512MB, 4-4-4-12).
Графическая карта: PowerColor RADEON X800 XT (PCI-E x16);
Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).

Для охлаждения Pentium 4 660 во время наших разгонных экспериментов мы воспользовались самым производительным воздушным кулером для LGA775 процессоров, имеющимся в нашей лаборатории: Zalman CNPS7700Cu. Напряжение питания процессора при разгоне мы не увеличивали: на старшие модели CPU с ядром Prescott 2M, как и на их предшественников, данный трюк не производит практически никакого впечатления. Разгон мы выполняли путём повышения частоты FSB свыше штатных 200 МГц, частоты шины PCI Express и PCI фиксировались при этом на номинальных значениях 100 и 33 МГц.
Перед тем, как перейти непосредственно к результатам нашего разгона, напомним, что максимальная частота, которую нам удалось достичь при оверклокинге Pentium 4 570, основанного на ядре Prescott степпинга E0, составила 4.3 ГГц. Подобных успехов от Pentium 4 660, ядро которого имеет большее число транзисторов, мы не ожидали. Однако, практика показала, что зря.
Ниже мы приводим скриншот CPU-Z, являющийся отражением наших успехов:


То есть, Pentium 4 660 со штатной частотой 3.6 ГГц разогнался до 4.33 ГГц. Это – достаточно хороший результат, подтверждающий значительный оверклокерский потенциал ядра Prescott 2M. Таким образом, младшие процессоры линейки Pentium 4 6XX могут стать весьма интересными объектами для разгона.
Мы же в очередной раз должны констатировать, что решение Intel не выпускать по 90 нм технологии процессоры с частотами 4 ГГц и более, обусловлено не достижением технологического предела, а скорее маркетинговыми причинами. Как мы вновь убеждаемся, существующие ядра Prescott и Prescott 2M степпингов E0 и N0 могут легко работать на частотах свыше 4 ГГц.

Как мы тестировали

Целью данного тестирования являлось определение уровня производительности, обеспечиваемого новыми процессорами серии Intel Pentium 4 6XX и процессором Intel Pentium 4 Extreme Edition 3.73 ГГц, а также сопоставление этого уровня с быстродействием предшествующих и конкурирующих CPU. Для наших тестовых испытаний мы выбрали две старших модели "шестисотой" серии, Pentium 4 660 со штатной частотой 3.6 ГГц и Pentium 4 650 с частотой 3.4 ГГц.

В составе тестовых систем мы использовали следующее оборудование:

Процессоры:

AMD Athlon 64 FX-55 (Socket 939, 1024KB L2, 2.6GHz);
AMD Athlon 64 4000+ (Socket 939, 1024KB L2, 2.4GHz);
AMD Athlon 64 3800+ (Socket 939, 512KB L2, 2.4GHz);
AMD Athlon 64 3500+ (Socket 939, 512KB L2, 2.2GHz);
Intel Pentium 4 570 (LGA775, 1024KB L2, 3.8 GHz);
Intel Pentium 4 560 (LGA775, 1024KB L2, 3.6 GHz);
Intel Pentium 4 550 (LGA775, 1024KB L2, 3.4 GHz);
Intel Pentium 4 660 (LGA775, 2048KB L2, 3.6 GHz);
Intel Pentium 4 650 (LGA775, 2048KB L2, 3.4 GHz);
Intel Pentium 4 Extreme Edition 3.46GHz (LGA775, 2048KB L3, FSB 1066MHz);
Intel Pentium 4 Extreme Edition 3.73GHz (LGA775, 2048KB L2, FSB 1066MHz);


Материнские платы:

EPoX 9NPA Ultra (Socket 939, NVIDIA nForce4 Ultra);
Intel Desktop Board D925XECV2 (LGA775, i925XE Express).


Память:

1024MB DDR400 SDRAM (Corsair CMX512-3200XLPRO, 2 x 512MB, 2-2-2-10);
1024MB DDR2-533 SDRAM (OCZ PC2 4300, 2 x 512MB, 4-4-4-11).


Графическая карта: PowerColor RADEON X800 XT (PCI-E x16).
Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).

Тестирование выполнялось в операционной системе MS Windows XP SP2 с установленным пакетом DirectX 9.0c. Тестовые системы настраивались на максимальную производительность. Заметим, что в Athlon 64 мы увеличивали тайминг Cycle Time (Tras) до 10, поскольку, как показывает практика, в таком режиме контроллер памяти Athlon 64 работает более эффективно, нежели при установке этой задержки в минимально возможное значение 5.
В рамках данного тестирования мы существенно расширили набор тестовых приложений. Произошло это благодаря тому, что мы решили задействовать набор стандартных скриптов PC WorldBench 5, широко используемый в индустрии для бенчмаркинга.

Производительность

FutureMark PCMark04, 3DMark2001 SE и 3DMark05

В первую очередь мы решили привести результаты, полученные нами в популярных синтетических тестах компании FutureMark.









Тест PCMark04 активно использует технологию Hyper-Threading, благодаря чему процессоры производства компании Intel показывают лучшие результаты. Что же касается соотношения сил между различными линейками процессоров Pentium 4, то процессоры "шестисотой" серии с увеличенной до 2 Мбайт кеш-памятью лишь незначительно превосходят CPU линейки Pentium 4 5XX. Зато процессор Pentium 4 Extreme Edition 3.73 ГГц, благодаря значительному росту тактовой частоты и более новому процессорному ядру, ощутимо обгоняет своего предшественника, Pentium 4 Extreme Edition 3.46 ГГц, в основе которого использовалось ядро Gallatin.
Достаточно интересные результаты получаются и в подтесте, измеряющем скорость работы подсистемы памяти. Увеличение L2 кеша в процессорах Pentium 4 6XX увеличило скорость их работы с данными, благодаря чему этим CPU в данном бенчмарке удаётся теперь выступать на равных с процессорами Athlon 64, сильной стороной которых является интегрированный контроллер памяти. То есть, увеличенная до 2 Мбайт кеш-память второго уровня нивелирует высокие задержки DDR2 SDRAM, используемой в составе современных Pentium 4 систем.


Старый тест 3DMark2001 SE никак не теряет своей популярности, однако на сегодня он уже гораздо сильнее показывает скорость центральных процессоров, нежели современных видеокарт. Раньше в этом тесте неизменно верхние места занимали CPU семейства Athlon 64, однако теперь ситуация несколько изменилась. Увеличение в новых процессорах Pentium 4 с ядром Prescott 2M кеш-памяти второго уровня позволило этим CPU несколько нарастить свои показатели в данном тесте. Благодаря этому Pentium 4 660 удалось обогнать Athlon 64 3500+, а Pentium 4 Extreme Edition 3.73 ГГц выступает на равных с Athlon 64 3800+. Конечно, назвать такие результаты успехом для Intel явно нельзя, однако этот факт является явным предвестником того, что в игровых приложениях увеличенный кеш процессоров с ядром Prescott 2M должен сказаться положительным образом.






Результаты, полученные в самом новом тестовом пакете от Futuremark, 3DMark05 также говорят нам о том, что увеличенная кеш-память новых процессоров Pentium 4 даёт определённый эффект при работе с игровой 3D графикой. Однако индекс производительности CPU из этого теста не позволяет Pentium 4 660 опередить Pentium 4 570, работающий на 200 МГц более высокой тактовой частоте. Впрочем, это не мешает при этом выставить на первое место по данному индексу процессор Pentium 4 Extreme Edition 3.73 ГГц, которому удаётся обогнать даже Athlon 64 FX-55.

Игровые приложения















С самого момента появления процессоров Athlon 64, CPU этого типа наголову побеждают своих конкурентов семейства Pentium 4 в игровых приложениях. Появление процессоров Pentium 4 6XX и Pentium 4 Extreme Edition 3.73 ГГц эту ситуацию не изменило. Несмотря на то, что увеличение кеш-памяти второго уровня привело к росту скорости Pentium 4 в играх примерно на 3-6%, Athlon 64 в 3D играх вновь оказываются значительно более быстрыми CPU. Положение не спасает и новый Pentium 4 Extreme Edition, уступающий в приложениях этого типа по скорости даже Athlon 64 3500+.

Офисные приложения


При работе в Microsoft Office скорость процессора оказывает небольшое влияние на производительность системы в целом.


Зато рендеринг веб-страниц в одном из самых популярных броузеров Mozilla (движок которого используется и в ещё более распространенном FireFox) на процессорах семейства Athlon 64 выполняется значительно быстрее, чем на конкурирующих CPU от Intel.


Впрочем, если во время работы с броузером в фоновом режиме выполняется какой-либо другой процесс, сильно загружающий ресурсы компьютера, результаты Pentium 4 оказываются несколько лучше, благодаря поддержке этими процессорами технологии Hyper-Threading.


Как видим, производительность ещё одного распространённого приложения, Nero, предназначенного для записи CD и DVD дисков также мало зависит от производительности центрального процессора.

Сжатие данных






Скорость работы приложений для сжатия данных напрямую зависит от тех алгоритмов, которые используются в этих приложениях. Как видим, WinZip несколько лучше оптимизирован для процессоров Intel, зато в WinRAR чудеса быстродействия показывают CPU семейства Athlon 64.
Кстати, по данным WinRAR, очень чутко реагирующего на любые изменения в архитектуре системы, увеличение кеш-памяти второго уровня даёт очень небольшой эффект: всего лишь порядка 3%.

Кодирование аудио и видео















В задачах кодирования видео традиционно выигрывают процессоры семейства Pentium 4. Приложения, используемые для сжатия видео контента, хорошо оптимизированы для NetBurst архитектуры и зачатую используют набор инструкций SSE3, который реально может увеличить производительность в программах этого рода. Поэтому, мы вновь вынуждены констатировать тот факт, что равных Pentium 4 при кодировании видео нет.
Что же касается кодирования аудио в формат mp3, то с этим процессом CPU от Intel и AMD справляются примерно с одинаковой скоростью.
Хочется отметить, что в задачах кодирования аудио и видео контента процессоры Pentium 4 6XX оказываются лишь немного быстрее, чем Pentium 4 5XX. Двукратное увеличение объёма кеш-памяти второго уровня в приложениях такого рода даёт прирост производительности менее 1%.

Редактирование изображений






Соотношение производительности между процессорами и в ACDSee, обладающем простейшими пакетными функциями для редактирования изображений, и в полновесном Adobe Photoshop примерно одинакова. Работа с изображениями на процессорах семейства Athlon 64 выполняется несколько быстрее, нежели на конкурирующих продуктах от Intel.
При этом мы вновь должны констатировать, что CPU семейства Pentium 4 6XX в приложениях этого типа опережают процессоры серии Pentium 4 5XX лишь на десятые доли процента. То есть, и в графических редакторах эффект от увеличения кеш-памяти в процессорах с ядром Prescott 2M проявляется весьма слабо.

Редактирование видео

Процессоры семейства Athlon 64 сильны именно благодаря своей вычислительной мощности. Поэтому их победа в специализированных пакетах для математических расчётов вполне закономерна.
Интересно же в этих тестах другое. Во-первых, Mathematica оказывается одним из немногих приложений, в котором размер кеш-памяти второго уровня имеет большое значение. Так преимущество процессоров с ядром Prescott 2M над процессорами с ядром Prescott, работающими на одинаковой тактовой частоте, оказывается порядка 7%, а это чуть ли не максимальное значение, наблюдаемое нами в данном тестировании. Во-вторых, Matematica очень лояльно отнеслась к процессору Pentium 4 Extreme Edition 3.46 ГГц, основанному на устаревшем 130 нм ядре Gallatin. Как видим, этот процессор, несмотря на свою относительно невысокую тактовую частоту, является в данном приложении лидером среди всех CPU от Intel.
Что же касается пакета MATLAB, то наблюдаемая в нём картина вполне привычна, поэтому полученные здесь результаты вряд ли нуждаются в дополнительных комментариях.
Производительность при финальном рендеринге в Lightwave очень сильно зависит от типа стоящегося изображения. В зависимости от этого в лидерах могут быть как процессоры Athlon 64, так и Pentium 4.
При этом заметим, что в любых задачах 3D рендеринга объём кеш-памяти второго уровня оказывает небольшое влияние на конечный результат. Этот относится как к процессорам Pentium 4 6XX, так и к Athlon 64 с мегабайтным L2 кешем.
Кроме того, обратите внимание на то, что в Lightwave процессоры Pentium 4 6XX проигрывают Pentium 4 5XX, работающим на аналогичной частоте. Скорее всего, этот факт объясняется именно большей медлительностью кеш-памяти второго уровня, реализованной в ядре Prescott 2M.

Выводы

В рамках данного обзора мы познакомились с семейством новых процессоров Intel, использующих в своей основе ядро Prescott 2M. Хотя на первый взгляд основным преимуществом этого ядра является увеличенный до 2 Мбайт L2 кеш, на деле процессоры на базе этого ядра содержат гораздо больше интересных нововведений, чем это кажется на первый взгляд. CPU линейки Pentium 4 6XX, являющиеся основными носителями ядра Prescott 2M на сегодняшний день, обладают не просто большей кеш-памятью, чем их предшественники, они снабжены рядом новых технологий, расширяющих их функциональность.
Тут в первую очередь следует отметить, что Pentium 4 6XX стали первыми массовыми CPU от Intel для настольных компьютеров, поддерживающими 64-битные расширения архитектуры x86. В свете скорого появления 64-битных пользовательских операционных систем, и в первую очередь Windows XP Professional x64 Edition, Intel поддержал инициативу AMD по внедрению архитектуры x86-64 и снабдил свои CPU соответствующими расширениями. Таким образом, теперь поддержка x86-64 прекращает быть прерогативой исключительно процессоров Athlon 64: конкурирующие продукты от Intel, процессоры Pentium 4 6XX теперь также имеют возможность работать с 64-битными приложениями и поддерживать более 4 Гбайт оперативной памяти.
Аналогичные 64-битные расширения архитектуры x86 получили и процессоры Pentium 4 Extreme Edition. Новая модель в этом семействе, Pentium 4 Extreme Edition 3.73 ГГц, которая основывается на новом ядре Prescott 2M, также поддерживает x86-64.
Нельзя обойти вниманием и тот факт, что новые процессоры Pentium 4 6XX получили в свое распоряжение набор технологий Demand Based Switching, благодаря которым снижается тепловыделение и энергопотребление этих процессоров в те моменты, когда от CPU не требуется работа "на пике своих возможностей". В процессорах семейства Pentium 4 6XX реализованы технологии C1E, TM2 и EIST и благодаря этому набору CPU данного типа большинство времени работают на частоте 2.8 ГГц при пониженном напряжении питания, разгоняясь до номинальной частоты лишь в те моменты, когда от системы необходима максимальная производительность.
Именно такой набор новых возможностей, реализованных в процессорах Pentium 4 6XX, позволил Intel установить на них достаточно высокие цены по сравнению с их предшественниками, Pentium 4 5XX с обычным ядром Prescott. Вот выдержка из нового официального прайс-листа (цены процессоров за 1 тыс. шт.):

Intel Pentium 4 Extreme Edition 3.73 GHz (3.73 GHz, 1066 MHz FSB, 2 MB L2) - $999;
Intel Pentium 4 660 (3.60 GHz, 800 MHz FSB, 2 MB L2) - $605;
Intel Pentium 4 650 (3.40 GHz, 800 MHz FSB, 2 MB L2) - $401;
Intel Pentium 4 640 (3.20 GHz, 800 MHz FSB, 2 MB L2) - $273;
Intel Pentium 4 630 (3.00 GHz, 800 MHz FSB, 2 MB L2) - $224.

Что же касается традиционного восприятия новых CPU, а именно их производительности, то нельзя сказать, что появление Pentium 4 "шестисотой серии" как-то повлияло на расстановку сил на процессорном рынке. Пока тактовая частота этих CPU уступает тактовой частоте старших процессоров Pentium 4 5XX, а увеличенный кеш второго уровня лишь незначительно позволяет поднять быстродействие. На графике ниже мы приводим относительную производительность Pentium 4 660 по сравнению с производительностью аналогичного по тактовой частоте процессора Pentium 4 560, основанного на обычном ядре Prescott с кеш-памятью второго уровня объёмом 1 Мбайт:


Как видим, в большинстве случаев эффект от увеличенной в два раза кеш-памяти второго уровня не превосходит 5%. Именно поэтому на сегодняшний день Pentium 4 570 с тактовой частотой 3.8 ГГц и кеш-памятью второго уровня 1 Мбайт следует считать более производительным CPU, нежели Pentium 4 660 с тактовой частотой 3.6 ГГц и 2-мегабайтной кеш-памятью. Сильные же стороны Pentium 4 6XX заключаются в первую очередь в поддержке EM64T и в наборе технологий C1E, TM2 и EIST.
Что же касается процессора Pentium 4 Extreme Edition 3.73 ГГц, то он приходит на смену Pentium 4 Extreme Edition 3.46 ГГц, основанному на ядре Gallatin. Смена ядра, перенос 2 Мбайт кеша с третьего уровня на второй и ощутимое увеличение тактовой частоты возымели своё дело и в целом, новый Extreme Edition стал побыстрее старого:


Однако данная картина наблюдается далеко не всегда и, более того, в игровых приложениях, на работу в которых в первую очередь и нацелены процессоры серии Extreme Edition, новый Pentium 4 Extreme Edition 3.73 ГГц не обгоняет своего предшественника. Все-таки 130 нм ядро Northwood и его производная Gallatin, использовавшаяся в Pentium 4 Extreme Edition 3.46 ГГц, в игровых приложениях работает более эффективно, нежели любой из Prescott.
Впрочем, вновь не следует забывать о том, что неоспоримым преимуществом Pentium 4 Extreme Edition 3.73 ГГц является поддержка 64-битных расширений EM64T.
Что же касается общей расстановки сил "AMD против Intel", то теперь мы можем констатировать, что по своим возможностям процессоры на ядре Prescott 2M уровнялись с процессорами Athlon 64. Так, взамен 64-битных расширений AMD64 у Athlon 64, в процессорах Pentium 4 6XX появились расширения EM64T. Аналогом технологии Cool"n"Quiet от AMD стала технология EIST от Intel, а кроме того процессоры Intel получили поддержку NX-бита (в терминах Intel XD-бита).
Производительность же старших моделей процессоров от Intel при этом пока всё ещё уступает скорости старших процессоров Athlon 64. Хотя, Pentium 4 продолжают лидировать в традиционных для себя областях, как то кодирование видео данных или финальный рендеринг, в большинстве приложений, а в первую очередь в играх, CPU от AMD показывают более высокое быстродействие.

Intel Pentium 4 («Интел Пентиум 4») - 32-битный микропроцессор седьмого поколения архитектуры x86, разработанный компанией Intel в ноябре 2000. Не является продолжением линии P6 (см. Pentium Pro, Pentium II, Pentium III) и выполнен на принципиально новом ядре.

От Pentium III отличается следующими характеристиками: поддержка технологии NetBurst; 144 новые инструкции SSE2, направленные на поддержку мультимедиа, видео и трехмерной графики, Интернет-технологий; 20-ступенчатый конвейер; улучшенный модуль предсказания переходов; 128-битная системная шина с тактовой частотой 100 МГц (эффективная частота 400 МГц); 2 АЛУ, работающих на удвоенной частоте ядра; кэш-память первого уровня с отслеживанием исполнения команд (Execution Trace Cache); 256 килобайт интегрированной кэш-памяти второго уровня с повышенной пропускной способностью (Advanced Transfer Cache); возможность использования производительной памяти RDRAM.

Несмотря на все улучшения, первые модели Pentium 4 (на ядре Willamette) показывали меньшую производительность, чем Pentium III или AMD Athlon с более низкими частотами. Низкая производительность, необходимость использования новых системных плат и дорогой памяти, а также дороговизна самих процессоров отрицательно сказалась на их популярности. Выпускались они по 0, 18-микронной технологии с частотами от 1, 3 до 2 ГГц и устанавливались в разъем Socket 423. В марте 2001 вышла серверная версия - Xeon, а в августе появились модели Pentium 4 для разъемов Socket 478, поддерживающие память SDRAM (вместо дорогостоящей RDRAM). Это позволило снизить цены на компьютеры с новыми процессорами, но еще сильней уменьшило их производительность.

В январе 2002, вслед за выходом конкурирующего AMD Athlon XP, компания выпустила новое ядро Northwood. Изготовлялось оно по 0, 13-микронной технологии, что позволило разместить на кристалле 512 килобайт кэш-памяти L2. В апреле к новому ядру была добавлена поддержка шины с частотой 133/533 МГц.

В этом же месяце была представлена мобильная версия процессора - Pentium 4-M, а в мае на старом ядре Willamette вышли бюджетные Celeron. В ноябре поступили в продажу первые модели на ядре Northwood с поддержкой технологии Hyper-Threading, а в апреле 2003 - шины 200/800 МГц. Процессоры на этом ядре выпускались с частотой от 1, 6 до 3, 4 ГГц. Проделанные улучшения позволили процессорам догнать и перегнать по производительности Athlon XP.

В сентябре 2003, за неделю да выхода Athlon 64 FX, появился высокопроизводительный процессор от Intel - Pentium 4 Extreme Edition. В феврале 2004 появилось новое ядро Prescott, выполненное по 0, 09-микронной технологии. По сравнению с предыдущим ядром, был увеличен конвейер (до 31 ступени) и кэш L2 (до 1 мегабайт), добавлены инструкции SSE3. В августе были добавлены инструкции EM64T (для 64-битных вычислений), а разъем сменился на Socket 775. В сентябре появилась поддержка технологии NX-Bit, а в феврале 2005 вышла новая версия этого ядра - Prescott 2M. Буквы 2M обозначали 2 мегабайта; именно таким стал размер интегрированной кэш-памяти L2. Кроме того, была добавлена поддержка технологии Enhanced SpeedStep, позволяющая операционной системе регулировать тактовую частоту процессора.

На ядрах Prescott и Prescott 2M выходили процессоры с частотами от 2, 4 до 3, 8 ГГц. К этому времени стало ясно, что производительность процессоров Pentium 4 зависит не только от их тактовой частоты. Поэтому, начиная с Prescott, процессорам дают условные обозначения, состоящие из нескольких букв и цифр (например, 519J), в которых зашифрованы такие факторы, как частота системной шины, размер кэш-памяти и поддерживаемые технологии.

В мае 2005 был представлен двухъядерный аналог Pentium 4 - Pentium D. Новая версия ядра для Pentium 4 называлась Cedar Mill. Появилась она в январе 2006 и представляла собой точную копию Prescott 2M, изготовленную по 0, 065-микронной технологии. В это же время появились процессоры, основанные на более старой архитектуре P6 - Intel Core Solo и Intel Core Duo. .

На момент начала продаж процессорные решения серии Intel Pentium 4 позволяли создавать наиболее производительные настольные вычислительные системы. Спустя 8 лет это семейство чипов устарело и было снято с производства. Именно об этом легендарном модельном ряде ЦПУ и пойдет в этом материале речь.

Позиционирование процессора

На самом старте продаж данные процессоры принадлежали к наиболее быстродействующим решениям. На подобную их принадлежность указывали передовая на тот момент архитектура полупроводникового кристалла NetBurst, существенно возросшие тактовые частоты и прочие значительно улучшенные технические характеристики. Как результат, владельцы персональных компьютеров на их базе могли решать любые по уровню сложности задачи. Единственная сфера, в которой эти чипы не применялись - это серверы. В таких высокопроизводительных вычислительных машинах использовались процессорные решения серии XEON. Также не совсем оправданно применение в составе офисных ПК Intel Pentium 4. Ядра такого чипа в этом случае не до конца нагружались и с экономической точки зрения такой подход был целиком и полностью не оправдан. Для ниши “Интел” выпускала менее производительные и более доступные ЦПУ серии Celeron.

Комплектация

В двух типичных вариантах поставки можно было встретить процессор Intel Pentium 4. Один из них был нацелен на небольшие компании, которые специализировались на сборке системных блоков. Также такой вариант поставки подходил для домашних сборщиков персональных компьютеров. В прайс-листах он обозначался ВОХ, а в него производитель включал следующее:

    Чип в защитной упаковке из прозрачного пластика.

    Фирменную систему теплоотвода, которая состояла из специальной термопасты и кулера.

    Талон с гарантийными обязательствами.

    Краткое руководство по назначению и использованию процессорного решения.

    Наклейка с логотипом модели чипа для передней панели системного блока.

Второй вариант поставки в каталогах компьютерных комплектующих обозначался TRAIL. В этом случае из списка поставки исключалась система охлаждения и ее необходимо было дополнительно приобретать. Подобный вид комплектации наиболее оптимально подходил для крупных сборщиков персональных компьютеров. За счет большого объема продаваемой продукции они могли позволить покупать системы охлаждения по более низким оптовым ценам и такой подход был оправдан с экономической точки зрения. Также такой вариант поставки пользовался повышенным спросом среди компьютерных энтузиастов, которые приобретали улучшенные модификации кулеров и это позволяло еще лучше разогнать такой процессор.

Процессорные разъемы

Процессор Intel Pentium 4 мог устанавливаться в один из 3-х видов процессорных разъемов:

Первый разъем появился в 2000 году и был актуальным до конца 2001 года. Затем ему на смену пришел PGA478, который вплоть до 2004 года занимал ведущие позиции в перечне продукции компании “Интел”. Последний сокет LGA775 появился на прилавках магазинов в 2004 году. В 2008 году его сменил LGA1156, который был нацелен на применение чипов с более передовой архитектурой.

Сокет 423. Семейства поддерживаемых чипов

Производители процессоров в лице компаний “Интел” и АМД в конце 1999 года - начале 2000 года постоянно расширяли перечень предлагаемых чипов. Только у второй компании была вычислительная платформа с запасом, которая базировалась на сокете PGA462. А вот “Интел” все возможное на тот момент из процессорного разъема PGA370 “выжала” и ее нужно было предлагать рынку компьютерных технологий что-то новое. Этим новым и стал рассматриваемый чип с обновленным процессорным разъемом в 2000 году. Intel Pentium 4 дебютировал одновременно с анонсом платформы PGA423. Стартовая частота процессоров в этом случае была установлена на отметке 1,3 ГГц, а наибольшее ее значение достигало 2,0 ГГц. Все ЦПУ в этом случае принадлежали к семейству Willamette, изготавливались по технологии 190 нм. Частота системной шины была равна реальным 100 МГц, а ее эффективное значение составляло 400 МГц.

Процессорный разъем PGA478. Модели ЦПУ

Через год в 2001 году вышли обновленные процессоры Intel Pentium 4. Socket 478 - это разъем для их установки. Как было уже отмечено ранее, этот сокет был актуальным вплоть до 2004 года. Первым семейством процессоров, которые в него могли быть установлены, стал Willamette. Наивысшее значение частоты для них было установлено на 2,0 ГГц, а начальное - 1,3 ГГц. Техпроцесс у них соответствовал 190 нм. Затем появилось в продаже семейство ЦПУ Northwood. Эффективное значение частоты в некоторых моделях в этом случае было увеличено с 400 МГц до 533 МГц. Частота чипов могла находиться в пределах от 2,6 ГГц до 3,4 ГГц. Ключевое же нововведение чипов этого модельного ряда - это появление поддержки технологии виртуальной многозадачности HyperTraiding. Именно с ее помощью на одном физическом ядре обрабатывалось сразу два потока программного кода. По результатам тестов получался 15-процентный прирост быстродействия. Следующее поколение чипов “Пентиум 4” получило кодовое название Prescott. Ключевые от предшественников в этом случае заключались в улучшенном технологическом процессе, увеличении кеш-памяти второго уровня и повышение тактовой частоты до 800 МГц. При этом сохранилась поддержка HyperTraiding и не увеличилось максимальное значение тактовой частоты - 3,4 ГГц. Напоследок необходимо отметить то, что платформа PGA478 была последней вычислительной платформой, которая не поддерживала 64-битные решения и могла выполнять лишь только 32-разрядный программный код. Причем это касается и системных плат, и процессорных решений Intel Pentium 4. Характеристики компьютеров на базе таких комплектующих являются целиком и полностью устаревшими.

Завершающий этап платформы Pentium 4. Сокет для установки чипов LGA775

В 2006 году производители процессоров начали активно переходить на 64-разрядные вычисления. Именно по этой причине Intel Pentium 4 перешел на новую платформу на основе разъема LGA775. Первым поколением процессорных устройств для нее называлось точно также, как и для PGA478 - Prescott. Технические спецификации у них были идентичны предыдущим моделям чипов. Ключевое отличие - это повышение максимальной тактовой частоты, которая в этом случае могла уже достигать 3,8 ГГц. Завершающим же поколением ЦПУ стало Cedar Mill. В этом случае максимальная частота понизилась до 3,6 ГГц, но при этом техпроцесс улучшился и энергоэффективность улучшилась. В отличие от предшествующих платформ, в рамках LGA775 “Пентиум 4” плавно перешел из сегмента решений среднего и премиального уровня в нишу процессорных устройств бюджетного класса. На его место пришли чипы серии Pentium 2, которые уже могли похвастаться двумя физическими ядрами.

Тесты. Сравнение с конкурентами

В некоторых случаях достаточно неплохие результаты может показать Intel Pentium 4. Processor этот отлично подходит для выполнения программного кода, который оптимизирован под один поток. В этом случае результаты будут сопоставимы даже с нынешними ЦПУ среднего уровня. Конечно, сейчас таких программ не так уж и много, но они все еще встречаются. Также этот процессор способен составить конкуренцию нынешним флагманам в офисных приложениях. В остальных случаях этот чип не может показать приемлемый уровень производительности. Результаты тестов будут приведены для одного из последних представителей данного семейства “Пентиум 4 631”. Конкурентами для него будут процессоры Pentium D 805, Celeron Е1400, Е3200 и G460 от “Интел”. Продукция же АМД будет представлена Е-350. Количество ОЗУ стандарта DDR3 равно 8 Гб. Также данная вычислительная система доукомплектована адаптером GeForce GTX 570 с 1 Гб видеопамяти. В трехмерных пакетах Maya, Creo Elements и Solid Works в актуальных версиях 2011 года рассматриваемая модель “Пентиум 4” показывает достаточно неплохие результаты. По результатам тестов в этих 3-х программных пакетах была выведена средняя оценка по сто балльной шкале и силы распределились следующим образом:

“Пентиум 4 631” проигрывает процессорам с более продвинутой архитектурой и более высокими тактовыми частотами G460 и Е3200, у которых 2 физических ядра. Но при этом обходит полноценную двухъядерную модель D 805 на аналогичной архитектуре. Результаты же Е-350 и Е1400 были предсказуемые. Первый чип ориентирован на сборку ПК, в которых на первый план выходит энергопотребление, а удел второго - это офисные системы. Совершенно по-другому распределяются силы при кодировании медиафайлов в программах Lame, Apple Lossless, Nero AAC и Ogg Vorbis. В этом случае на первый план уже выходит количество ядер. Чем их больше, тем лучше выполняется задача. Опять-таки, по усредненной сто балльной шкале силы распределились следующим образом:

Даже Е-350 с приоритетом на энергоэффективность обходит “Пентиум 4” модели 631. Продвинутая архитектура полупроводникового кристалла и наличие 2-х ядер все-таки дают о себе знать. Изменяется картина при тестировании процессоров в архиваторах WinRAR и 7-Zip. Результаты чипов по той же самой шкале распределились так:

В этом тесте множество факторов оказывает влияние на конечный результат. Это и архитектура, это и размер кеша, это и тактовая частота, это и количеств ядер. Как результат, типичным середнячком получился тестируемый “Пентиум 4” в исполнении 631. Эталонная же система, производительность которой соответствовала 100 баллам, базировалась на ЦПУ Athlon II Х4 модели 620 от АМД.

Разгон

Внушительным увеличением уровня производительности мог похвастаться Intel Pentium 4. Разгон этих процессорных устройств позволял достичь значений тактовой частоты в 3,9-4,0 ГГц при улучшенной воздушной системе охлаждения. Если же заменить воздушное охлаждение на жидкостное на базе азота, то вполне можно рассчитывать на покорение значения в 4,1-4,2 ГГц. Перед разгоном компьютерная система должна быть укомплектована следующим образом:

    Мощность блока питания должна быть минимум 600 Вт.

    В компьютере должна быть установлена продвинутая модель системной платы, на которой можно осуществлять плавное регулирование различных параметров.

    Кроме основного кулера, на процессоре в системном блоке должны находиться дополнительные 2-3 вентилятора для осуществления улучшенного теплоотвода.

Мультипликатор частоты в этих чипах был заблокирован. Поэтому простым поднятием его значения разогнать ПК невозможно. Поэтому единственный способ увеличения производительности - это увеличение реального значения тактовой частоты системной шины. Порядок же разгона в этом случае следующий:

    Уменьшаются значения частот всех компонентов ПК. В этот список лишь только не попадает лишь только системной шины.

    На следующем этапе увеличиваем рабочее значение частоты последней.

    После каждого такого шага необходимо проверить стабильность работы компьютера с помощью прикладного специализированного софта.

    Когда простого повышения частоты уже недостаточно начинаем повышать напряжение на ЦПУ. Его максимальное значение равно 1,35-1,38 В.

    После достижения наибольшего значения напряжения частоту чипа повышать нельзя. Это и есть режим максимального быстродействия компьютерной системы.

В качестве примера можно привести модель 630 процессора “Пентиум 4”. Ее стартовая частота равна 3 ГГц. Номинальная же тактовая частота системной шины составляет в этом случае 200 МГц. Значение последней можно на воздушном охлаждении повысить вплоть до 280-290 МГц. В результате ЦПУ будет работать уже на 4,0 ГГц. То есть прирост производительности составляет 25 процентов.

Актуальность на сегодняшний день

На сегодняшний день целиком и полностью устарели все процессоры Intel Pentium 4. Температура их функционирования, энергопотребление, технологический процесс, тактовые частоты, размер кеш-памяти и ее организация, количество адресуемой ОЗУ - это далеко не полный перечень тех характеристик, которые указывают на то, что это полупроводниковое решение устарело. Возможностей такого чипа лишь достаточно для решения наиболее простых задач. Поэтому владельцам таких компьютерных систем необходимо их обновлять в срочном порядке.

Стоимость

Несмотря на то что в 2008 году выпуск рассматриваемых ЦПУ был прекращен, их все еще можно купить в новом состоянии со складских запасов. При этом необходимо отметить то, что в исполнении LGA775 и с поддержкой технологии НТ можно приобрести чипы Intel Pentium 4. Цена на них находится в пределах 1300-1500 рублей. Для офисных систем это вполне адекватный уровень стоимости. Процессорные решения, которые находились в использовании, можно найти на различных торговых площадках в интернете. Цена в этом случае начинается с отметки в 150-200 рублей. Полностью же собранный персональный компьютер бывший в употреблении можно купить по цене от 1500 рублей.