Первоначально, по предварительной договоренности, мы планировали просто протестировать графическую станцию, предоставленную нам компанией Intel, на базе двух процессоров Intel Xeon E5-2650 v.2. Идея заключалась в том, чтобы, протестировав ее, продемонстрировать целесообразность использования двух процессоров в графических (рабочих) станциях. Понятно, что такое тестирование имеет смысл только в том случае, если результаты проведенных тестов есть с чем сравнить. И для сравнения мы изначально выбрали мощный компьютер на базе нового восьмиядерного процессора Intel Core i7-5960X (Haswell-E), а также еще две конфигурации на базе шестиядерных процессоров Ivy Bridge-E и Sandy Bridge-E.
Впрочем, с самого начала все пошло не так, как мы планировали. Во-первых, то, что нам привезли, никак нельзя было назвать графической станцией. Собственно, это был классический двухпроцессорный сервер в пьедестальном корпусе Intel Server System P4000CP на базе системной платы Intel S2600CP. В этом сервере имелась лишь «бортовая» видеокарта, предназначенная для настройки сервера, но никак не для работы в режиме графической станции.
Поэтому, дабы превратить этот сервер в рабочую станцию, мы доукомплектовали его дискретной видеокартой Nvidia Quadro K5200, предоставленной компанией Nvidia. Впрочем, и тут возникли свои подводные камни, поскольку плата Intel S2600CP оказалось не лучшим решением для этой графической карты. Дело в том, что на плате имеется шесть слотов PCI Express 3.0: один выполнен в форм-факторе PCI Express х16, а все остальные — в форм-факторе PCI Express х8. Однако все шесть слотов работают в режиме PCI Express 3.0 х8 — нет ни одного, который бы работал в режиме PCI Express 3.0 х16.
Далее, как выяснилось, установить нашу видеокарту Nvidia Quadro K5200 в слот с форм-фактором PCI Express х16 здесь вообще не представляется возможным. Дело в том, что сразу за этим слотом располагаются слоты для установки модулей памяти, которые препятствуют установке длинной видеокарты.
Таким образом, какую-нибудь короткую видеокарту, типа Nvidia Quadro 600 (мы пробовали и с ней), установить можно, а вот Nvidia Quadro K5200 в отведенном пространстве уже не умещается. Впрочем, эта проблема решается, поскольку среди слотов с форм-фактором PCI Express х8 есть слоты с открытым концом. В итоге видеокарту Nvidia Quadro K5200 мы в эту систему установили, но с учетом того, что она будет работать в режиме x8, а не в режиме х16.
Попутно отметим, что с установкой мощной игровой видеокарты проблемы возникают еще более серьезные. К примеру, установить видеокарту Asus GeForce GTX 980 оказалось невозможно: она немного повыше, чем Nvidia Quadro K5200, и упирается в пластиковый воздуховод корпуса. Есть и другая проблема с установкой этой видеокарты: дело в том, что к ней нужно подвести дополнительное питание (на восьмиконтактный и шестиконтактный разъемы), но в блоке питания корпуса Intel Server System P4000CP имеется только один периферийный разъем. Соответственно, потребуется Y-разветвитель с периферийного разъема и переходники с периферийного разъема на шестиконтактный и на восьмиконтактный разъемы видеокарты. С Nvidia Quadro K5200 вопрос решается проще — там нужно подвести дополнительное питание только к шестиконтактному разъему, то есть требуется лишь переходник с периферийного разъема на шестиконтактный разъем. Ну а в случае с Asus GeForce GTX 980 все сложнее, и даже если запитать оба разъема, не факт, что карте хватит питания (ведь оно берется с одного периферийного разъема). Впрочем, не будем отвлекаться. В конце концов, сама идея установить в сервер игровую видеокарту как минимум странная.
С учетом того, что сам по себе сервер на базе шасси Intel Server System P4000CP и системной платы Intel S2600CP с двумя процессорами Intel Xeon E5-2650 v.2 еще не является полноценной графической станцией, мы решили немного изменить первоначальную идею тестирования и сконцентрироваться на тестировании рабочей станции, которая получается из сервера добавлением в него профессиональной графической карты Nvidia Quadro K5200. Ну а сравнивать производительность этой двухпроцессорной рабочей станции мы будем с рабочими станциями на базе восьмиядерного процессора Intel Core i7-5960X (Haswell-E), а также шестиядерных процессоров Core i7-4960X (Ivy Bridge-E) и Core i7-3970X (Sandy Bridge-E). Естественно, для тестирования мы отобрали приложения и бенчмарки, специфические именно для графических и рабочих станций.
Методика тестирования
Мы уже сравнивали производительность процессоров Intel Core i7-5960X, Core i7-4960X и Core i7-3970X, используя для этого тесты из нашего пакета iXBT Notebook Benchmark v.1.0, а также такие бенчмарки, как SPECapc for 3ds max 2015 для пакета Autodesk 3ds max 2015, Cadalyst 2015 Benchmark v.5.5 для пакета Autodesk AutoCAD 2015, встроенный бенчмарк для приложения POV-Ray 3.7 (версия бенчмарка 2.01) и бенчмарк Maxon Cinebench R15. Однако, учитывая, что речь идет о процессорах, которые используются в графических и рабочих станциях, мы решили расширить тестовый пакет, добавив еще несколько специализированных приложений и бенчмарков. Кроме того, учитывая специфику приложения Autodesk AutoCAD 2015, его использование для тестирования рабочих станций мы сочли нецелесообразным.
В результате для тестирования графической/рабочей станции были отобраны следующие бенчмарики и приложения:
- MediaCoder x64 0.8.25.5560
- Adobe Premiere Pro CC
- Adobe After Effects CC
- Photodex ProShow Gold 5.0.3276
- Adobe Photoshop CC
- SPECapc for 3ds max 2015
- SPECapc for Maya 2015
- Dassault SolidWorks 2014 SP3 (пакет Flow Simulation)
- POV-Ray 3.7
- Maxon Cinebench R15
- SPECviewperf 12.0.1
- SPECwpc 1.0.4
Тестирование проводилось под управлением операционной системы Windows 8 (64-битной).
В первых пяти приложениях (MediaCoder x64 0.8.25.5560, Adobe Premiere Pro CC, Adobe After Effects CC, Photodex ProShow Gold 5.0.3276 и Adobe Photoshop CC) использовались тесты (нагрузка) из нашего пакета iXBT Notebook Benchmark v.1.0. Отметим, что это чисто процессорные тесты, и их результаты практически не зависят от используемой видеокарты. Ну и дабы предвосхитить возможные вопросы, подчеркнем, что в приложении Adobe After Effects CC не используется мультипроцессинг (After Effects Multiprocessing), который позволяет рендерить различные кадры на разных ядрах процессора. Дело в том, что фильтры, используемые нами, несовместимы с данной технологией. Впрочем, это не означает, что при рендеринге одного кадра не задействуются все ядра процессора.
Для приложения Autodesk 3ds max 2015 SP1 мы использовали бенчмарк SPECapc for 3ds max 2015. В этом тестовом пакете содержится 48 отдельных подтестов, которые позволяют измерять производительность отдельных подсистем ПК в пакете Autodesk 3ds max 2015 SP1. Результатом теста являются нормированные баллы, а в качестве референсной системы используется рабочая станция Dell Precision 690 с процессором Intel Xeon 5130 (2 ГГц), 16 ГБ (4×4 ГБ) ECC-памяти FB-DIMM DDR2, графической картой Nvidia Quadro Q600 и HDD Western Digital 500 ГБ (7200 об/мин). Результаты всех тестов сводятся к одиннадцати интегральным оценкам (CPU Composite Score, GPU Composite Score и т. д.). Отметим, что в бенчмарке SPECapc for 3ds max 2015 все тесты запускаются трижды, а результаты усредняются по трем прогонам. Кроме того, в настройках бенчмарка можно указать разрешение и уровень антиалиасинга. Мы запускали тест с настройками по умолчанию (без антиалиасинга).
Для приложения Autodesk Maya 2015 мы использовали бенчмарк SPECapc for Maya 2012, который совместим с этим приложением после незначительной доработки, не влияющей на результаты теста. Бенчмарк включает 50 отдельных подтестов, позволяющих измерять производительность отдельных подсистем ПК в пакете Autodesk Maya 2015. Результатом теста являются нормированные баллы для графической подсистемы и процессора, а в качестве референсной системы используется рабочая станция Dell Precision 690 с процессором Intel Xeon 5130 (2 ГГц), 16 ГБ (4×4 ГБ) ECC-памяти DDR2-667 и графической картой Nvidia Quadro FX 570.
Для пакета Dassault SolidWorks 2014 SP3 мы разработали свой собственный бенчмарк. Собственно, в данном случае речь идет не о рендеринге и не о трансформациях трехмерных моделей, а о расчетах задач по аэрогидродинамике и теплопередаче с использованием дополнительного модуля Flow Simulation. В тесте используется шесть реальных проектов, которые входят в пакет SolidWorks Flow Simulation в качестве примера. Это такие проекты, как тепловой расчет корпуса компьютера, в котором имеются тепловыделяющие элементы и один вентилятор (conjugate heat transfer), расчет машины для подготовки текстильных волокон (textile machine), расчет вращающейся крыльчатки насоса (rotating impeller), расчет процессорного кулера (cpu cooler), расчет галогенового светильника (halogen floodlight) и расчет системы охлаждения компьютера в замкнутом корпусе с вентилятором, процессором, чипсетом, радиатором, тепловыми трубками и т. д. (electronic components). Более подробно обо всех проектах, используемых для расчета, можно узнать по ссылке. Все проекты для теста SolidWorks Flow Simulation подбирались таким образом, чтобы, во-первых, время расчета было разумным (не превышало 15 минут), а во-вторых, для тестов мы отобрали только те проекты, которые дают стабильный результат по времени расчета. Результатом данного теста является время расчета каждого проекта.
Бенчмарк, встроенный в приложение POV-Ray 3.7, производит рендеринг трехмерных изображений методом трассировки лучей. Результатом данного теста является время рендеринга и среднее количество пикселей, которые рендерятся в секунду (Pixel Per Second, PPS).
Известный бенчмарк Cinebench R15 компании Maxon Computer основан на пакете трехмерной графики и анимации Maxon Cinema 4D и, как заявляет производитель, Cinebench R15 измеряет производительность системы, основываясь на реальном производственном процессе в Cinema 4D. Тестирование состоит из двух частей, отдельно оценивающих производительность процессора и графической карты. Тестирование процессора заключается в рендеринге трехмерной сцены, которая состоит из порядка 280 000 полигонов. Результат тестирования отображается в безразмерных баллах (cb). Для тестирования производительности графической карты используется сложная трехмерная сцена, которая рассчитывается графической картой с поддержкой OpenGL. Эта сцена содержит большое количество геометрии (около 1 миллиона полигонов), текстуры с высоким разрешением и различные эффекты. Результат отображается в количестве кадров в секунду (fps).
Тестовый пакет SPECviewperf 12.0.1 традиционно используется для тестирования профессиональных графических карт и графических станций. Естественно, результаты этого тестового пакета зависят не только от производительности графической карты, но и от производительности процессора. Это синтетический тестовый пакет в том смысле, что в нем нет реальных приложений — работа в них лишь имитируется. Всего имитируется работа в восьми различных пакетах, специфических именно для графических станций:
- CATIA V6 R2012 (CAD/CAM-проектирование);
- Creo 2 (CAD/CAM-проектирование);
- Energy (имитация типичной нагрузки в приложениях, использующихся для геофизических исследований — сейсмологические прогнозы и геологическая разведка месторождений нефти и газа);
- Autodesk Maya 2013 (пакет трехмерного моделирования);
- Medical (имитация работы в медицинских приложениях, в которых двухмерные изображения, полученные с помощью компьютерного томографа или магнитно-резонансного томографа, объединяются в целостную трехмерную визуализацию);
- Autodesk Showcase 2013 (CAD/CAM-проектирование);
- Dassault SolidWorks 2013 SP1 (CAD/CAM-проектирование);
- Siemens NX 8.0 (CAD/CAM-проектирование).
Нужно отметить, что результаты тестового пакета SPECviewperf часто вызывают справедливое недоверие. Во всяком случае, именно так обстояло дело с предыдущей версией SPECviewperf 11. Все дело в том, что данный тестовый пакет претендует на роль отраслевого стандарта, и производители профессиональных видеокарт прикладывают немалые усилия для оптимизации драйверов именно под этот тестовый пакет. Впрочем, в нашем случае для сравнения производительности процессоров это не критично, поскольку мы используем одну и ту же видеокарту и один и тот же видеодрайвер на всех тестовых системах.
Ну и последний тестовый пакет, который мы использовали для тестирования, это SPECwpc v.1.0.4. Данный тестовый пакет предназначен для оценки производительности рабочих станций. Это полусинтетический бенчмарк, в состав которого входят как синтетические тесты (типа IOMeter), так и тесты на основе реальных приложений (типа Blender). SPECwpc v.1.0.4 включает более 30 различных тестов, которые позволяют измерять производительность процессора, графической подсистемы, подсистемы ввода/вывода и памяти. Все тесты разбиты на шесть логических групп, которые отражают различные аспекты использования рабочей станции:
- Мedia and Entertaiment (транскодирование видео, рендеринг трехмерных изображений, создание трехмерных моделей)
- Product Development (CAD/CAM-приложения — сюда входит большинство тестов из пакета SPECviewperf 12)
- Life Sciences (молекулярная динамика (LAMMPS, NAMD), медицинские приложения)
- Financial Services (финансовые расчеты)
- Energy (геофизические расчеты)
- General Operation (общие приложения)
По каждой группе тестов вычисляется нормированный результат, а в качестве референсной системы используется рабочая станция на базе процессора Intel Xeon X3430 с 8 ГБ памяти, графической картой ATI FirePro V4800 и HDD c интерфейсом SATA (7200 об/мин). Тестовый пакет SPECwpc v.1.0.4 является относительно новым, и пока еще преждевременно говорить о том, насколько он адекватен. Первое впечатление от этого тестового пакета можно выразить так: внушает доверие. Отметим, что один прогон теста SPECwpc v.1.0.4 даже на высокопроизводительном ПК занимает более 4 часов. Также отметим, что на сайте производителя есть база с результатами данного тестового пакета.
Конфигурация тестовых стендов
Итак, мы протестировали четыре различные конфигурации рабочих станций. Причем новый восьмиядерный процессор Intel Core i7-5960X тестировался дважды: в штатном режиме и при разгоне до частоты 4,2 ГГц.
Конфигурации тестовых стендов представлены в таблице:
Конфигурация рабочей станции | |||
Процессор | 2×Xeon E5-2650 v.2 | Core i7-5960X | Core i7-4960X/3970X |
Материнская плата | Intel S2600CP | Asus X99-A | Asus Sabertooth X79 |
Оперативная память | 8×4 ГБ DDR3-1600 | 4×4 ГБ DDR4-2133 | 4×4 ГБ DDR3-2133 |
Видеокарта | Nvidia Quadro K5200 (драйвер 340.84) | ||
Режим работы видеокарты | PCI Express 3.0 x8 | PCI Express 3.0 x16 | PCI Express 3.0 x16/PCI Express 2.0 x16 |
Накопитель | RAID 0 (2× Intel SSD 530 Series 120 ГБ) | Intel SSD 520 Series 240 ГБ | |
Операционная система | Windows 8 (64-битная) |
Отметим, что в рабочей станции на базе двух процессоров Intel Xeon E5-2650 v.2 подсистема хранения данных представляет собой RAID-массив уровня 0 (на базе интегрированного контроллера LSI Mega RAID), созданный из двух SSD-накопителей Intel SSD 530 Series. Причем сами SSD-накопители были подключены к портам SATA 3 Гбит/с.
Собственно, именно в таком виде (с установленной операционной системой) к нам и попала рабочая станция Intel. На наш взгляд, такая конфигурация не вполне логична, поскольку на плате имеется и два порта SATA 6 Гбит/с с возможностью создания RAID-массива, и логичнее было бы подключить скоростные накопители Intel SSD 530 Series именно к этим портам. Однако мы решили оставить все в том виде, в котором это было сконфигурировано специалистами компании Intel. На всех остальных тестовых стендах использовался только один SSD-накопитель Intel SSD 520 Series (240 ГБ), который подключался к порту SATA 6 Гбит/с. Конечно, для чистоты эксперимента можно было бы сделать подсистемы хранения данных одинаковыми во всех тестовых конфигурациях, однако в тестах на основе реальных приложений влияние дисковой подсистемы на результаты тестов очень незначительно. Если точнее, то после определенного уровня производительности скоростные показатели подсистемы хранения данных уже перестают оказывать влияние на общую производительность системы (соответственно, и на результаты тестов). Кроме того, для двухпроцессорной рабочей станции использование RAID-массива выглядит вполне логичным.
Результаты тестирования
Ну а теперь обратимся к результатам наших тестов. Для наглядности мы приведем результаты тестов и в виде таблиц, и в нормированном виде на диаграммах. Нормировку мы проводили относительно процессора Intel Core i7-5960X в штатном режиме работы. В таблицах результаты отражены в тех единицах измерения, в которых они получаются в тестах. Причем поскольку некоторые тесты (SPECapc for 3ds max 2015 и SPECwpc v1.0.4) выдают очень много результатов, на диаграммах для этих тестов мы приведем лишь основные из них.
Тесты из пакета iXBT Notebook Benchmark v.1.0
Начнем с тестов, входящих в состав бенчмарка iXBT Notebook Benchmark v.1.0.
Тест | 2 × Xeon E5-2650 v.2 | Core i7-5960X (штатный режим) | Core i7-5960X @4.2 ГГц | Core i7-4960X (штатный режим) | Core i7-3970X (штатный режим) |
MediaCoder x64 0.8.25.5560, секунды | 52,1 | 70,4 | 55,5 | 84,1 | 93,5 |
Adobe Premiere Pro CC, секунды | 185,2 | 223,1 | 182,1 | 248,4 | 276,7 |
Adobe After Effects CC, секунды | 432,2 | 504,8 | 424,0 | 500,2 | 529,0 |
Photodex ProShow Gold 5.0.3276, секунды | 417,1 | 381,7 | 330,8 | 331,6 | 347,9 |
Adobe Photoshop CC, секунды | 979,6 | 721,0 | 623,5 | 607,0 | 631,7 |
В тесте транскодирования видео с использованием утилиты MediaCoder x64 0.8.25.5560 лидером является двухпроцессорная графическая станция. Она почти на 35% опережает по скорости транскодирования компьютер с процессором Intel Core i7-5960X. Тем не менее, в состоянии разгона один процессор Core i7-5960X почти догоняет по скорости транскодирования два процессора Xeon E5-2650 v.2.
В приложении Adobe Premiere Pro CC лидером опять-таки является двухпроцессорная рабочая станция, которая опережает систему на базе процессора Core i7-5960X по скорости выполнения тестового задания на 20%. Но при разгоне процессора Core i7-5960X он не только догоняет, но даже немного опережает два процессоре Xeon E5-2650 v.2.
В приложении Adobe After Effects CC результат аналогичный. В штатном режиме двухпроцессорная рабочая станция опережает систему на базе процессора Core i7-5960X почти на 20%, а при разгоне Core i7-5960X система на его основе не только догоняет, но и немного превосходит двухпроцессорную рабочую станцию.
Вообще, говоря о таких пакетах, как Adobe After Effects CC и Adobe Premiere Pro CC, стоит отметить, что результаты наших тестов, возможно, и не вполне объективны — в том смысле, что можно сделать тест, который в большей степени будет зависеть от количества ядер процессора. Впрочем, можно создать и тест, который бы в большей степени переносил вычисления на GPU. У нас изначально не стояла задача продемонстрировать преимущество многоядерных процессоров или преимущества мощной графики — мы просто взяли реальные проекты. Поэтому вывод в данном случае можно сделать такой: не во всех проектах Adobe After Effects CC и Adobe Premiere Pro CC два процессора Xeon E5-2650 v.2 (общее количество логических ядер 32) позволяют получить весомое преимущество над однопроцессорной системой с процессором Core i7-5960X (общее количество логических ядер 16).
В тесте на основе приложения Photodex ProShow Gold 5.0.3276 (создание анимированного слайд-шоу) двухпроцессорная рабочая станция проигрывает всем остальным конфигурациям. В данном тесте важнее не количество ядер, а тактовая частота.
В приложении Adobe Photoshop CC получается примерно аналогичный результат. В этом приложении два процессора Xeon E5-2650 примерно на 25% уступают по скорости обработки фотографий процессору Core i7-5960X в штатном режиме работы. Впрочем, это и понятно. Как мы уже демонстрировали в предыдущей статье, посвященной процессору Core i7-5960X, Adobe Photoshop CC эффективно может использовать только шесть ядер процессора (12 логических ядер). Ну а при 32 логических ядер все только тормозится.
SPECapc for 3ds max 2015
Далее рассмотрим результаты теста SPECapc for 3ds max 2015 для приложения Autodesk 3ds max 2015 SP1. Подробные результаты этого теста представлены в таблице, а нормированные результаты для CPU Composite Score и GPU Composite Score — на диаграммах.
Тест | 2 × Xeon E5-2650 v.2 | Core i7-5960X (штатный режим) | Core i7-5960X @4.2 ГГц | Core i7-4960X (штатный режим) | Core i7-3970X (штатный режим) |
CPU Composite Score | 5,35 | 5,61 | 6,64 | 4,97 | 4,82 |
GPU Composite Score | 2,86 | 4,32 | 4,81 | 3,9 | 4,04 |
Large Model Composite Score | 2,29 | 4,35 | 5,01 | 3,36 | 3,56 |
Large Model CPU | 1,8 | 2,44 | 2,92 | 2,38 | 2,5 |
Large Model GPU | 2,91 | 7,74 | 8,61 | 4,74 | 5,08 |
Interacive Graphics | 2,65 | 4,21 | 4,71 | 3,76 | 3,93 |
Advanced Visual Styles | 3,95 | 5,29 | 5,9 | 5,18 | 5,36 |
Modeling | 1,97 | 3,03 | 3,4 | 2,86 | 2,95 |
CPU Computing | 3,5 | 3,76 | 4,29 | 3,66 | 3,65 |
CPU Rendering | 8,57 | 8,42 | 10,19 | 6,92 | 6,49 |
GPU Rendering | 4,09 | 5,58 | 6,18 | 4,84 | 4,93 |
В тесте SPECapc 3ds for max 2015 двухпроцессорная рабочая станция уступила однопроцессорной системе на базе Core i7-5960X по всем показателям. Одним словом, для трехмерного моделирования в приложении Autodesk 3ds max 2015 нет никакого смысла в использовании двухпроцессорной системы на базе Xeon E5-2650 v.2.
SPECapc for for Maya 2012
Теперь посмотрим на результат еще одного теста трехмерного моделирования — SPECapc 3ds for Maya 2012. Напомним, что данный бенчмарк запускался в паре с пакетом Autodesk Maya 2015.
Тест | 2 × Xeon E5-2650 v.2 | Core i7-5960X (штатный режим) | Core i7-5960X @4.2 ГГц | Core i7-4960X (штатный режим) | Core i7-3970X (штатный режим) |
GFX Score | 2,92 | 3,75 | 4,24 | 3,54 | 3,6 |
CPU Score | 3,44 | 4,82 | 5,58 | 4,76 | 4,56 |
В этом тесте двухпроцессорная рабочая станция опять проиграла однопроцессорной системе на базе Core i7-5960X (и всем остальным системам). То есть и для пакета Autodesk Maya 2015 нет смысла в использовании двухпроцессорной системы.
POV-Ray 3.7
В тесте POV-Ray 3.7 (рендеринг трехмерной модели) лидером является двухпроцессорная рабочая станция. В данном случае все логично: для рендеринга чем больше логических ядер, тем лучше. И 32 ядра рабочей станции в данном случае обеспечивают скорость рендеринга на 50% выше, чем 16 ядер процессора Core i7-5960X.
Тест | 2 × Xeon E5-2650 v.2 | Core i7-5960X (штатный режим) | Core i7-5960X @4.2 ГГц | Core i7-4960X (штатный режим) | Core i7-3970X (штатный режим) |
Render average, PPS | 4025,0 | 2688,88 | 3373,67 | 1223,02 | 1930,27 |
Cinebench R15
В бенчмарке Cinebench R15 результат оказался неоднозначным. В тесте OpenGL двухпроцессорная система проигрывает всем остальным конфигурациям, а в тесте процессорного рендеринга, наоборот, выигрывает.
Тест | 2 × Xeon E5-2650 v.2 | Core i7-5960X (штатный режим) | Core i7-5960X @4.2 ГГц | Core i7-4960X (штатный режим) | Core i7-3970X (штатный режим) |
OpenGL, fps | 108,0 | 176,66 | 205,07 | 135,44 | 137,8 |
CPU, cb | 2072 | 1326 | 1636 | 1081 | 1011 |
Расчеты в приложении Dassault SolidWorks 2014 SP3 (Flow Simulation)
В гидро/аэродинамических и тепловых расчетах в пакете Dassault SolidWorks 2014 SP3 c модулем Flow Simulation результаты во всех тестах очень схожи. По времени расчета лидером является система на базе процессора Core i7-5960X в разогнанном состоянии. Далее следует система на базе процессора Core i7-4960X. Третье место делят между собой системы на базе процессора Core i7-5960X (в штатном режиме работы) и процессора Core i7-3970X. Ну а на последнем месте оказалась рабочая станция на базе двух процессоров Xeon E5-2650 v.2.
Тест | 2 × Xeon E5-2650 v.2 | Core i7-5960X (штатный режим) | Core i7-5960X @4.2 ГГц | Core i7-4960X (штатный режим) | Core i7-3970X (штатный режим) |
conjugate heat transfer | 516 | 402 | 343 | 374 | 399 |
textile machine | 442 | 377 | 320 | 372 | 400 |
rotating impeller | 293 | 251 | 215 | 228 | 245 |
cpu cooler | 860 | 746 | 613 | 691 | 729 |
halogen floodlight | 584 | 292 | 243 | 284 | 320 |
electronic components | 849 | 592 | 502 | 538 | 575 |
SPECviewperf v.12.0.1
В тестах пакета SPECviewperf v.12.0.1 результаты для всех конфигураций примерно одинаковы, хотя в большинстве тестов двухпроцессорная рабочая станция немного уступает всем остальным конфигурациям. Вообще же нужно отметить, что пакет SPECviewperf v.12.0.1 в большей степени ориентирован на тестирование именно видеокарты, и возможно, для процессоров его результаты не очень показательны.
Тест | 2 × Xeon E5-2650 v.2 | Core i7-5960X (штатный режим) | Core i7-5960X @4.2 ГГц | Core i7-4960X (штатный режим) | Core i7-3970X (штатный режим) |
catia-04 | 77,77 | 90,44 | 95,71 | 85,47 | 85,47 |
creo-01 | 61,9 | 69,23 | 70,63 | 69,72 | 69,21 |
energy-01 | 3,57 | 3,44 | 3,41 | 3,41 | 3,47 |
maya-04 | 58,96 | 66,83 | 70,9 | 65,4 | 67,31 |
medical-01 | 28,62 | 28,63 | 28,9 | 28,56 | 28,6 |
showcase-01 | 49,17 | 48,83 | 49,0 | 49,02 | 49,13 |
snx-02 | 78 | 81,54 | 81,4 | 81,57 | 81,93 |
sw-03 | 88,88 | 108,4 | 118,9 | 109,9 | 114,21 |
SPECwpc v.1.0.4.
Ну и последний бенчмарк — это специализированный тестовый пакет для рабочих станций SPECwpc v.1.0.4.
Нельзя сказать, что в этом тесте все однозначно. В некоторых сценариях (Media and Entertaiment, General Operation) более высокий результат демонстрирует система на базе одного процессора Core i7-5960X. Есть сценарии (Life Sciences, Financial Services), где преимущество на стороне двухпроцессорной рабочей станции. Наконец, в случае Product Development и Energy можно говорить о примерно одинаковой производительности.
Нужно отметить, что в таком синтетическом тесте, как IOMeter, двухпроцессорная рабочая станция с RAID-массивом уровня 0 из двух SSD-накопителей во всех сценариях (Media and Entertaiment, Product Development, Life Sciences, Energy, General Operation) проигрывает однопроцессорным системам с одним SSD-накопителем. Возможно, это особенность накопителей Intel SSD 530 Series, сконфигурированных в RAID-массив уровня 0. Возможно, это особенность RAID-контроллера на плате Intel S2600CP. Но в любом случае этот синтетический тест подсистемы хранения данных сказывается на результирующем интегральном результате. И если бы не это обстоятельство, то результаты тестов для двухпроцессорной рабочей станции были бы выше. Собственно, в данном случае вопрос в том, насколько адекватно учитывать результат синтетического теста IOMeter в равной степени с результатами остальных тестов.
Тест | 2 × Xeon E5-2650 v.2 | Core i7-5960X (штатный режим) | Core i7-5960X @4.2 ГГц | Core i7-4960X (штатный режим) | Core i7-3970X (штатный режим) |
Media and Entertaiment | 5,2 | 5,5 | 6,3 | 4,9 | 4,7 |
Blender | 3,1 | 3,1 | 3,8 | 2,9 | 2,8 |
HandBrake | 4,3 | 3,7 | 5,6 | 3,2 | 2,9 |
LuxRender | 6,7 | 4,5 | 5,6 | 3,4 | 3,2 |
IOMeter | 8,3 | 16,7 | 16,9 | 15,3 | 15,6 |
Maya | 5,2 | 5,8 | 6,2 | 5,7 | 5,8 |
Product Development | 4,5 | 4,2 | 5,3 | 4,7 | 4,3 |
Rodinia | 7,3 | 4,8 | 6,0 | 4,2 | 3,3 |
CalculiX | 1,5 | 1,6 | 1,9 | 1,7 | 1,5 |
WPCcfg | 3,8 | 3,1 | 3,3 | 3,2 | 2,9 |
IOmeter | 9,9 | 22,1 | 22,3 | 19,8 | 20,4 |
catia-04 | 4,9 | 5,7 | 6,1 | 5,4 | 5,5 |
showcase-01 | 4,8 | 4,7 | 4,7 | 4,8 | 4,8 |
snx-02 | 4,4 | 4,4 | 4,4 | 4,4 | 4,4 |
sw-03 | 4,3 | 5,1 | 5,7 | 5,2 | 5,5 |
Life Sciences | 5,9 | 5,4 | 6,3 | 5,6 | 5,0 |
Lammps | 5,9 | 4,0 | 4,5 | 4,7 | 3,4 |
namd | 6,1 | 4,0 | 5,0 | 3,5 | 3,1 |
Rodinia | 4,0 | 2,3 | 3,6 | 3,0 | 2,7 |
Medical-01 | 10,1 | 10,1 | 10,1 | 10,1 | 10,1 |
IOMeter | 5,0 | 11,9 | 10,1 | 11,2 | 11,4 |
Financial Services | 6,4 | 4,0 | 5,2 | 3,2 | 3,0 |
Monte Carlo | 6,7 | 4,1 | 5,2 | 3,4 | 3,2 |
Black Scholes | 6,9 | 4,1 | 5,3 | 3,5 | 3,1 |
Binomial | 5,6 | 3,8 | 4,9 | 2,8 | 2,7 |
Energy | 6,0 | 5,8 | 7,0 | 5,7 | 5,1 |
FFTW | 3,8 | 3,7 | 3,7 | 2,9 | 2,8 |
Convolution | 9,5 | 5,5 | 6,9 | 4,8 | 4,1 |
Energy-01 | 29,2 | 27,1 | 27,8 | 28,7 | 28,0 |
srmp | 7,2 | 4,8 | 5,6 | 4,4 | 3,6 |
Kirchhoff Migration | 9,5 | 5,5 | 6,9 | 4,9 | 3,3 |
Poisson | 0,7 | 1,3 | 2,3 | 1,9 | 1,9 |
IOMeter | 5,4 | 12,6 | 12,9 | 11,8 | 11,9 |
General Operation | 4,0 | 4,7 | 5,6 | 4,8 | 4,7 |
7Zip | 4,5 | 4,5 | 5,3 | 4,4 | 4,5 |
Python | 2,5 | 2,0 | 2,7 | 2,8 | 2,3 |
Octave | 1,2 | 1,4 | 1,7 | 1,5 | 1,3 |
IOMeter | 19,6 | 40,4 | 40,9 | 34,3 | 36,6 |
Выводы
В заключение еще раз подчеркнем, что мы не смогли сравнить в равных условиях два процессора Xeon E5-2650 v.2 с процессором Core i7-5960X. Хотя во всех тестовых конфигурациях мы использовали одну и ту же графическую карту, в случае двухпроцессорной рабочей станции она работала в режиме PCIe 3.0 x8, а в случае процессора Core i7-5960X — в режиме PCIe 3.0 x16. Впрочем, пропускная способность интерфейса в данном случае вряд ли является ограничивающим фактором. Действительно, с процессором Core i7-3970X (Sandy Bridge-E) эта карта вообще работала в режиме PCIe 2.0 x16, и нельзя сказать, что по результатам процессор Core i7-3970X сильно уступает процессору Core i7-4960X (Ivy Bridge-E), который обеспечивал режим PCIe 3.0 x16.
Есть и еще один спорный момент, касающийся различий в подсистеме хранения данных двухпроцессорной рабочей станции и всех остальных тестовых конфигураций. Как уже отмечалось, в нашей графической станции подсистема хранения данных представляет собой RAID-массив уровня 0 на базе встроенного в чипсет RAID-контроллера LSI, а сам массив собран из двух накопителей Intel SSD 530 Series 120 ГБ. В случае всех остальных тестовых конфигураций подсистема хранения данных — это один накопитель Intel SSD 520 Series 240 ГБ. Казалось бы, в данном случае двухпроцессорная рабочая станция находится в более выигрышном положении, однако тесты ничего подобного не показывают: по результатам синтетического теста IOMeter производительность подсистемы хранения данных двухпроцессорной рабочей станции оказывается ниже производительности одиночного SSD-накопителя в остальных тестовых системах.
В целом, по результатам нашего тестирования можно сделать следующий вывод. Рабочая станция на базе двух процессоров предыдущего поколения Intel Xeon E5-2650 v.2 далеко не во всех приложениях и сценариях загрузки способна обеспечить такой же уровень производительности, как однопроцессорная рабочая станция на базе нового процессора Core i7-5960X. И получается, что новый друг лучше (и, кстати, дешевле) старых двух.