Как мы и обещали в прошлый раз, сегодня мы займемся процессорами Intel Core i7, причем основной упор будет сделан на модели с более высокой производительностью, нежели имеет i7-880. Необходимость их тестирования по новой методике возникла не только сама по себе, но и потому, что считанные дни остаются до анонса платформы LGA2011. В первую очередь она (как и ее предшественница LGA1567) предназначена для многопроцессорных высокопроизводительных систем, однако попутно именно ей предстоит на настольном рынке прийти на смену экстремальной LGA1366, существующей уже без малого три года.
Таким образом, в сегменте «компьютеров для энтузиастов» закончится уже поднадоевшее двоевластие, когда наилучшие результаты на большинстве массового программного обеспечения демонстрируют процессоры архитектуры Sandy Bridge для LGA1155, но максимальную отдачу от многопоточного ПО можно получить при помощи шестиядерных процессоров Gulftown, появившихся полтора года назад и относящихся к более старой микроархитектуре Westmere. Несколько слотов PCIe x16 (что может пригодиться для серьезных milti-GPU-решений) без дополнительных костылей обеспечиваются сейчас только в рамках LGA1356, которая на рынке уже порядком зажилась, и как раз в играх Sandy Bridge существенно выигрывают у предшественников, что делает подобное разделение платформ еще более обидным. Вот вскоре с ним и покончат путем выпуска многоядерных Sandy Bridge E-семейства, кроме новой архитектуры способных предложить пользователю и встроенный контроллер PCIe с поддержкой уже 40 линий данного интерфейса, что позволит без каких-либо сложных выкрутасов реализовывать схемы типа х16+х16 или х16+х8+х8 или даже х8+х8+х8+x8, что в рамках платформы LGA1155 достижимо лишь при помощи дополнительных чипов.
В общем, для сравнения с такими «новичками» нам потребуются результаты наиболее производительных «старичков», получением которых мы сегодня и займемся. Но не только — заодно протестируем и некоторые «младшие из старших» процессоров, так что можете считать эту статью также своеобразным продолжением цикла про «границы производительности» применительно к семейству Core i7.
Конфигурация тестовых стендов
Процессор | Core i7-860 | Core i7-880 | Core i7-2600 |
Название ядра | Lynnfield | Lynnfield | Sandy Bridge QC |
Технология пр-ва | 45 нм | 45 нм | 32 нм |
Частота ядра (std/max), ГГц | 2,8/3,46 | 3,06/3,73 | 3,4/3,8 |
Стартовый коэффициент умножения | 21 | 23 | 34 |
Схема работы Turbo Boost | 5-4-1-1 | 5-4-2-2 | 4-3-2-1 |
Кол-во ядер/потоков вычисления | 4/8 | 4/8 | 4/8 |
Кэш L1, I/D, КБ | 32/32 | 32/32 | 32/32 |
Кэш L2, КБ | 4×256 | 4×256 | 4×256 |
Кэш L3, МиБ | 8 | 8 | 8 |
Частота UnCore, ГГц | 2,4 | 2,4 | 3,4 |
Оперативная память | 2×DDR3-1333 | ||
Видеоядро | — | — | GMA HD 2000 |
Сокет | LGA1156 | LGA1156 | LGA1155 |
TDP | 95 Вт | 95 Вт | 95 Вт |
Цена | Н/Д(3) | Н/Д(1) | $340(32) |
С платформами LGA1156 и LGA1155 все просто. Для первой было выпущено четыре модели Core i7, среди которых легко и однозначно определяются младшая и старшая — 860 и 880. Случай LGA1155 еще более прозрачный: в рамках этой платформы существуют два подходящих процессора, полностью идентичные друг другу в штатном режиме с использованием дискретной графики, так что все стрелки указывают на Core i7-2600. В ближайшее время компания Intel планирует выпустить новую модель для любителей разгона, а именно Core i7-2700K (кстати: насчет ее «обычного» аналога пока ничего не слышно), которая фактически заменит i7-2600K по цене и позиционированию, но принципиальной разницы между двумя процессорами нет: каких-то 100 МГц тактовой частоты, т. е. всего порядка 3%, что приведет лишь к пропорциональному приросту производительности (в лучшем случае). Впрочем, если 2700К появится одновременно или чуть раньше, чем SB-E, протестируем и его. Но не сейчас :) Еще для обеих платформ выпускались энергоэффективные модели, но они находятся несколько в стороне от магистральной линии, так что сегодня мы ими заниматься не будем.
Процессор | Core i7-920 | Core i7-970 | Core i7-990X |
Название ядра | Bloomfield | Gulftown | Gulftown |
Технология пр-ва | 45 нм | 32 нм | 32 нм |
Частота ядра (std/max), ГГц | 2,66/2,93 | 3,2/3,47 | 3,47/3,73 |
Стартовый коэффициент умножения | 20 | 24 | 26 |
Схема работы Turbo Boost | 2-1-1-1 | 2-1-1-1-1-1 | 2-1-1-1-1-1 |
Кол-во ядер/потоков вычисления | 4/8 | 6/12 | 6/12 |
Кэш L1, I/D, КБ | 32/32 | 32/32 | 32/32 |
Кэш L2, КБ | 4×256 | 6×256 | 6×256 |
Кэш L3, МиБ | 8 | 12 | 12 |
Частота UnCore, ГГц | 2,13 | 2,13 | 2,66 |
Оперативная память | 3×DDR3-1066 | ||
Видеоядро | — | — | — |
Сокет | LGA1366 | LGA1366 | LGA1366 |
TDP | 130 Вт | 130 Вт | 130 Вт |
Цена | Н/Д(2) | Н/Д(1) | Н/Д(2) |
А вот в рамках LGA1366 все менее однозначно. Со старшей моделью, впрочем, проблем никаких: это Core i7-990X Extreme Edition. До ее появления тоже наблюдалось своеобразное двоевластие, поскольку в малопоточных задачах Gulftown обычно проигрывал равночастотному Bloomfield, так что экстремальные 980Х и 975 боролись за первое место с переменным успехом, но выход 990Х с более высокой, чем у 975, тактовой частотой, быстро расставил все по своим местам. А вот младших процессоров тут… два. Первый — безоговорочно младший Core i7-920, появившийся одновременно со стартом платформы в конце 2008 года. Причем долгое время этот процессор был не только младшим в семействе, но и попросту единственно доступным массовому покупателю Core i7, что было исправлено лишь после появления в сентябре следующего года Core i7-860. Соответственно, 920 был чуть ли не самым популярным процессором для LGA1366. Сейчас-то, понятно, в качестве новой покупки он абсолютно не интересен, но имеется на руках у немалого числа пользователей, так что не протестировать его мы не вправе. А еще был Core i7-970 — младший из линейки шестиядерных «настольных» процессоров. Опять же — особого смысла в его покупке уже нет, поскольку по той же цене отгружается Core i7-980 (который не следует путать с Core i7-980X Extreme Edition, что некоторые иногда делают), однако отличаются эти процессоры (как обычно) только на один шаг тактовой частоты, а во всем остальном одинаковы. Поэтому нам интереснее было протестировать именно 970.
Никаких процессоров AMD сегодня в тестировании не будет. Поскольку, как мы уже установили, лучший из них, а именно Phenom II X6 1100T, по общей усредненной производительности примерно равен лишь Core i7-860 или Core i5-2400, сравнивать его с такими моделями, как i7-2600 или i7-990X, не имеет никакого смысла. По цене тоже — это совсем другой класс. Да и появление «бульдозера» FX-8150 существенных изменений в «картину мира» не внесло: он где-то быстрее предшественника, где-то даже медленнее, но все равно отсносится чуть к иному классу, нежели Core i7. Вот когда AMD вернется в топовый сегмент, тогда и мы вернемся к ее продукции в рамках тестирования высокопроизводительных решений. А пока, увы — оные в ассортименте AMD просто отсутствуют.
Системная плата | Оперативная память | |
LGA1155 | Biostar TH67XE (H67) | Corsair Vengeance CMZ8GX3M2A1600C9B (2×1333; 9-9-9-24) |
LGA1156 | ASUS P7H55-M Pro (H55) | Corsair Vengeance CMZ8GX3M2A1600C9B (2×1333; 9-9-9-24) |
LGA1366 | Intel DX58SO2 (X58) | 12 ГБ 3×1333; 9-9-9-24 / 3×1066; 8-8-8-19 (9x0 / 990X) |
Обычно мы комплектуем тестовые системы 8 ГБ оперативной памяти, однако для LGA1366 сделали исключение — поскольку это единственная на рынке система с трехканальным контроллером памяти, мы решили мимо таковой ее «особенности» не проходить. Ну а если установить в каждый канал по модулю на 4 ГБ (как мы обычно и делаем) суммарный объем памяти составит, ни много ни мало, все 12 ГБ. В рамках тестирований по предыдущей методике эта платформа имела аналогичную фору — 6 ГБ против типовых 4 ГБ. И нередко ей это помогало :) Вот и посмотрим — обнаружится ли в современных приложениях эффект от увеличения памяти до 12 ГБ, или это пустая трата денег. Разная тактовая частота памяти обусловлена тем, что у обычных и экстремальных процессоров под LGA1366 разная частота UnCore. Хотя в принципе модели на ядре Gulftown в «ручном режиме» поддерживают и соотношение 2:3, а не только 1:2 (это позволяет использовать высокоскоростную память без разгона данного блока, да и разогнать последний тоже можно), такой возможностью мы пользоваться не стали. Может быть, в рамках какого-нибудь специального тестирования и займемся. Хотя, с другой стороны, уже, пожалуй, и не стоит — платформа пока еще актуальная, но жить ей осталось, как уже было сказано в начале статьи, недолго :) Тем более, что все предыдущие тестирования показывали, что эффект от собственно быстрой памяти куда меньше, чем от разгона UnCore, так что большей пользы можно добиться, не гоняясь за высокочастотными «оверклокерскими» модулями, а как раз применяя «дефолтное» 1:2 и разгоняя именно кэш.
Тестирование
Традиционно, мы разбиваем все тесты на некоторое количество групп и приводим на диаграммах средний результат по группе тестов/приложений (детально с методикой тестирования вы можете ознакомиться в отдельной статье). Результаты на диаграммах приведены в баллах, за 100 баллов принята производительность референсной тестовой системы iXBT.com образца 2011 года. Основывается она на процессоре AMD Athlon II X4 620, ну а объем памяти (8 ГБ) и видеокарта (NVIDIA GeForce GTX 570 1280 МБ в исполнении Palit) являются стандартными для всех тестирований «основной линейки» и могут меняться только в рамках специальных исследований. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.
Интерактивная работа в трёхмерных пакетах
Лидерство Core i7-2600 в особых объяснениях не нуждается: лучший из Sandy Bridge — и этим все сказано. Результаты остальных испытуемых располагаются в порядке убывания тактовой частоты, а она в этой традиционно малопоточной группе зависит от работы технологии Turbo Boost, которая в Lynnfield «агрессивнее», нежели в Bloomfield и Gulftown. Core i7-990X спасает только то, что и стартовая-то частота у него очень высокая, а вот моделям 970 и, в особенности, 920 «крыть» тут нечем :)
Финальный рендеринг трёхмерных сцен
В общем-то, для такого применения (в первую очередь) многоядерные процессоры и создаются, так что в победе шести ядер (что в итоге дает аж 12 вычислительных потоков) никто и не сомневался. Однако и эффективность новой архитектуры никуда не делась: модели 990Х удавалось обойти 880 в полтора раза (что логично), но вот ее преимущество над 2600 сократилось до более скромных 20-25%. Так что можно сразу спрогнозировать, что старший многоядерный SB-E «набьет» в этом тесте в районе 400 баллов и быстро покажет, кто в доме хозяин :)
Упаковка и распаковка
Емкий кэш и способность 7-Zip при сжатии данных эффективно использовать много потоков вычисления все равно не позволяют Gulftown одержать убедительную победу. Экстремальный 990Х, впрочем, сумел захватить высшую ступеньку пьедестала, но уже 970 заметно отстал от 2600. Опять же — ждем новых рекордов после появления в наших руках процессоров для платформы LGA2011: там с числом ядер все хорошо, а с архитектурой и кэш-памятью — так и вовсе просто замечательно.
Кодирование аудио
Данный тест построен так, что «подыгрывает» многоядерным процессорам — если бы мы запускали множество одновременных операций независимо от физического числа ядер, очень может быть, что результаты стали бы менее ярко выраженными. Но даже в текущем виде становится очевидным, что при одинаковой архитектуре шесть ядер, конечно, лучше четырех, но «грубая сила» решает далеко не всё — улучшения в Sandy Bridge позволяют сократить отставание до минимума.
Компиляция
Шесть ядер, 12 потоков, 12 МБ кэш-памяти L3 — результат предсказуем. Тем более, как мы уже замечали, компиляторы достаточно прохладно относятся к улучшениям новой архитектуры, так что прирост близок к объяснимому простой разницей в тактовых частотах ядер и кэша. Впрочем, повторимся — окончательная точка и здесь будет поставлена ближе к концу октября ;)
Математические и инженерные расчёты
Похоже на первую группу, хотя тут уже действительно есть, что посчитать, и Core i7-970 выглядит не так уж и бледно. Но обогнать или хотя бы догнать Core i7-2600 у него все едино не выходит — для этого надо было бы иметь еще и преимущество по тактовой частоте, чего нет.
Растровая графика
Кое-что здесь уже оптимизировано под многопоточность, но далеко не всё. Поэтому Gulftown уже может оторваться от более старых ядер, но все еще неспособен победить Sandy Bridge. Тем более, что даже там, где оптимизация есть, четыре ядра последних оказываются весьма внушительной силой: i7-2600 обошел модель i7-990X в Photoshop и почти не отстал от нее в ACDSee. С закономерным общим итогом.
Векторная графика
А вот тут поддержки многопоточности практически никакой, так что результат тоже закономерный: главное — архитектура, а при прочих равных — тактовая частота, что в совокупности и дает максимальную «однопоточную производительность», требуемую в данном случае.
Кодирование видео
Казалось бы, медиакодирование — та область, где тренд на увеличение количества ядер альтернатив не имеет. И правильно казалось, но… Архитектурные усовершенствования сбрасывать со счетов тоже не стоит. А ведь в новом семействе не только улучшили то, что было реализовано ранее, но и добавили новые инструкции, в частности набор AVX. Последний уже поддерживается, например, кодером x264. Возможно, это было не единственным фактором, повлиявшим на итоговый результат, но важен именно результат. А он таков: в этом тесте Core i7-2600 обгоняет соперника в лице Core i7-970 несмотря на полуторакратное отставание по числу ядер! Аналогичная картина и в тесте Microsoft Expression Encoder. Более старые программы, конечно, в большей степени предпочитают именно многоядерность новизне каждого ядра, однако, как видим, даже в такой традиционно лояльной к многопоточности области, как кодирование видео, в итоге i7-970 показал практически одинаковый с i7-2600 результат, а i7-990X сумел сохранить за собой первое место, но с весьма скромным перевесом: каких-то 10%. Вот старые четырехъядерные Core i7 он громил с легкостью, а теперь нашла коса на камень.
Офисное ПО
Мягко говоря, не самая интересная для тестируемых сегодня процессоров предметная область — очевидно, что быстродействие таковых здесь избыточно. Даже самый медленный Core i7-920 на 40% обходит наш эталонный Athlon II X4 620, которого для офиса всё едино уже много :) Так что просто полюбуемся на результаты, а их объяснений было достаточно и в тексте выше — оригинальностью эти приложения не отличаются.
Java
Доработка теста в новой методике позволила «сняться с ручника» шестиядерным монстрам Intel, хотя, как видим, не так уж оно им и помогло. Несмотря на то, что JVM предпочитает «настоящие» ядра «виртуальным» потокам, старый шестиядерник недалеко уходит от нового четырехъядерника. Вот если сравнивать близкие архитектуры — тут преимущество более чем очевидно.
Игры
Худо-бедно, но игровые движки потихоньку осваивают многопоточность. Хотя, в чем мы уже не раз убеждались, главный водораздел проходит между процессорами, выполняющими лишь два потока вычислений одновременно (а такие нынче встречаются только в самом бюджетном секторе), и всеми остальными. Последнюю группу, впрочем, тоже уже можно достаточно четко разделить на «четырехпоточники» и «четырехъядерники», хотя есть сильное ощущение, что немалую роль в таком разделении играет большая емкость кэш-памяти у последних, а вовсе не «честная многоядерность». Но все эти баталии происходят «где-то там» — ниже 200 долларов. А сегодня у нас процессоры более высокого класса. Где и ядер как минимум четыре, и Hyper-Threading ими всеми поддерживается. В общем, переводя с русского на русский — по большому счету, даже «старичка» Core i7-920 хватит для всех игровых упражнений, и нет ничего удивительного в том, что здесь прочие участники обогнали его в куда меньшей степени, чем в других тестах. Ну а победителем стал Core i7-2600 — большой кэш в Gulftown компенсируется низкой частотой его работы, а ядер просто больше, чем много.
Итого
У идеального сферического компьютерного энтузиаста в том вакууме, где он обитает, должно быть как минимум два высокопроизводительных компьютера. Один — на паре Xeon X5690 (аналог Core i7-990X, но способный работать в двухпроцессорной конфигурации) где-нибудь в чулане: нужен для того, чтобы решать «тяжелые» задачи, типа кодирования, рендеринга и прочего. И второй — на каком-нибудь процессоре «второго поколения Core» (может быть, даже двухъядерном Core i3-2130): для интерактивных задач. Но поскольку ничего идеального в природе не бывает, а живем мы далеко не в вакууме, наиболее разумным компромиссом для всех сфер применения сейчас является Core i7-2600 в единственном мощном десктопе. Да, конечно, шестиядерный экстремал сумел обойти его в общем зачете, но всего на 10% при втрое более высокой цене. Да и преимущество наблюдается вовсе не в ежедневных задачах — в них как раз 990Х не блещет. Впрочем, тем, для кого рендеринг или видеомонтаж является основной сферой применения компьютера, любой из Gulftown, конечно, подойдет в максимальной степени. По крайней мере, до конца октября — когда, как мы уже говорили в начале статьи, двоевластие закончится, поскольку на рынке появятся шестиядерные процессоры архитектуры Sandy Bridge.
Но нужно ли вообще столько ядер на десктопе? В целом, как видим, польза от них есть, причем заметная, но только в весьма специфических областях. Т. е. если пользователь найдет задачу для такого дредноута — тот себя, безусловно, покажет. А если не найдет — получится просто дорогой обогреватель :) Попутно, кстати, можно поставить окончательную точку в прошлогодних спорах о том, что перспективнее: LGA1156 или LGA1366. Была такая достаточно популярная точка зрения: возьму сейчас недорогой Core i7-930, а когда подешевеют шестиядерные модели — «малой кровью» проведу модернизацию. Однако, как это часто бывает, программа «шерсть в обмен на перспективность» дала сбой. Де-юре LGA1155 пришла на замену LGA1156, но де-факто эта платформа сделала бессмысленной для большинства пользователей и покупку шестиядерного процессора под LGA1366. Да, неэкстремальные модели последних появились, но что толку? Все равно и 970, и 980 стоят на уровне комплекта из 2600 и хорошей системной платы, а превосходство над последним могут продемонстрировать лишь в небольшом (относительно) числе задач. Есть таковые среди постоянно используемых? Тогда, с одной стороны, есть и польза от покупки, а с другой — она была бы больше, если б сразу купить даже экстремальный Core i7-980X, не дожидаясь снижения цен: за полгода-год вложения бы вполне «отбились» (пусть даже только психологическим эффектом). Кроме того, чем далее, тем полезность относительно «устаревших» процессоров становится меньше из-за прогресса в области производства ПО: напомним, что в тесте x264 Core i7-2600 обогнал «старичка» 970. Как раз в удобной для последнего задаче!
В общем, многоядерные процессоры продолжают оставаться своеобразной «вещью в себе». Другой вопрос, что всего несколько лет назад под «много» понималось «четыре», а сейчас процессоры с таким числом ядер спустились и в массовый сегмент. И их производительность постоянно растет: напомним, опять же, что 920, 860 и 2600 — это процессоры с одной ценовой планки. Только разного времени: конец 2008-го, вторая половина 2009-го и начало 2011 года соответственно. Ну а в 2010-м по той же цене продавались не показанные на диаграмме 870/950/960. Т. е. процесс увеличения производительности за ту же цену является непрерывным. Итог его — примерно полуторакратный рост за чуть более чем два года. На том же количестве ядер и с более низким энергопотреблением — просто за счет архитектурных усовершенствований. А вниманию тех пользователей, кому таки нужно больше (и они готовы за это платить), ныне предлагаются и шестиядерные процессоры, способные поспорить по производительности с былыми двухпроцессорными системами. И, разумеется, последние тоже никуда не делись, соответствующим образом «нарастив мускулатуру». В общем, революции больше не нужны — при такой-то эволюции ;)