Сегодня виртуализация широко используется практически в любой части ИТ-индустрии — от личных мобильных устройств до мощных вычислительных центров, позволяя решать самые разные задачи. Виртуализация может выступать в разных формах — начиная от виртуализации и эмуляции платформ, заканчивая виртуализацией ресурсов. Но сегодня речь пойдет о нативной аппаратной виртуализации — современные процессоры поддерживают ее с помощью наборов инструкций, таких как Intel VT-x или AMD-V.
Нативная виртуализация — это технология, предоставляющая вычислительные ресурсы, абстрагированные от аппаратного уровня. Если брать, например, сегмент серверов, такое абстрагирование позволяет работать нескольким виртуальным системам на одной аппаратной платформе, а также дает возможность легко переносить виртуальные системы с одного аппаратного сервера на другой — например, при его выходе из строя или модернизации.
До появления аппаратной поддержки виртуализации, все плюсы технологии перекрывали большие потери производительности и низкая скорость работы виртуальной машины в целом. Популярность виртуальных машин стала расти по мере того, как производители аппаратных платформ стали предпринимать активные шаги по снижению издержек на виртуализацию (появление аппаратной поддержки, введение новых инструкций, сокращение таймингов при выполнении инструкций), а производительность процессоров стала достаточной, чтобы «тянуть» виртуальные машины с приемлемой скоростью.
Как уже говорилось выше, один из ключевых факторов для нормальной работы нативной аппаратной виртуализации — поддержка процессором специфических наборов инструкций. Intel представила свой набор инструкций VT-x в 2005 году, еще в рамках архитектуры Netburst, применявшейся в процессорах Pentium 4. AMD разработала свой набор инструкций, AMD-V, и первые процессоры с его поддержкой вышли на рынок в 2006 году. Некоторое время спустя обе компании предложили новые наборы инструкций: Intel EPT (Extended Page Tables) и AMD RVI (Rapid Virtualization Indexing) соответственно. Суть обоих наборов в том, что гостевая ОС получает контроль над виртуализованными страницами памяти напрямую, минуя гипервизор — это снижает нагрузку на него и несколько поднимает скорость виртуальной системы. Для проброса напрямую устройств в гостевую ОС компания Intel разработала набор инструкций Intel VT-d. В арсенале Intel имеются и другие наборы инструкций для виртуализации: Intel VT FlexMigration, Intel VT FlexPriority, VPID, VT Real Mode, VMFUNC.
В новых поколениях процессоров производители не только предлагают новые возможности наборов инструкций виртуализации, но и сокращают тайминги выполнения конкретных инструкций, что позволяет повысить производительность виртуальной системы в целом. Для примера, в процессорах Pentium 4 задержка на выполнение инструкций VMCALL и VMRESUME приближалась к 1500 наносекундам, а в Core 2 Duo (Penryn) она составляла уже менее 500 наносекунд.
Сокращение разрыва в производительности между реальной и виртуальной системой сделало виртуальные машины (ВМ) гораздо более выгодными в использовании, в том числе для решения задач корпоративного уровня. Наиболее очевидными достоинствами являются повышение средней загрузки оборудования (несколько ВМ равномерно используют ресурсы аппаратной платформы, сокращая время простоя), а также запуск устаревшей ОС, которая не удовлетворяет современным требованиям (например, по безопасности), но при этом необходима для запуска и работы уникального ПО (или в силу иных причин). Кстати говоря, столь популярные на сегодня облачные сервисы также имеют в своей основе технологии виртуализации. Суммируем основные преимущества, которые предприятие получает от применения виртуализации. Это:
- увеличение средней загрузки физического сервера, а, следовательно, и коэффициента использования аппаратуры, что, в свою очередь снижает общую стоимость АО;
- простота миграции виртуальных серверов с одного физического на другой при апгрейде аппаратного обеспечения;
- простота восстановления работоспособности виртуального сервера при аппаратном сбое оборудования: виртуальную машину значительно проще перенести на другой физический сервер, чем переносить конфигурацию и ПО с одной физической машины на другую;
- существенное упрощение перевода пользователей или бизнес-процессов на новые ОС и новое ПО: использование ВМ позволяет делать это по частям и не трогая аппаратные ресурсы; кроме того, в процессе можно легко анализировать и исправлять ошибки, а также оценивать целесообразность внедрения «на лету»;
- поддержка в бизнес-процессах работы устаревшей ОС, от которой по каким-либо причинам в данный момент времени невозможно отказаться;
- возможность тестирования тех или иных приложений на ВМ, не требуя дополнительного физического сервера и т. д.
- другие сферы применения.
Таким образом, целесообразность использования виртуализации на сегодняшний день уже не вызывает вопросов. Технология предоставляет слишком много плюсов с точки зрения организации бизнеса, что заставляет закрывать глаза даже на неизбежные потери производительности системы.
Тем не менее, всегда полезно понимать, о каком именно уровне потерь производительности между реальной и виртуальной системой идет речь. Тем более, что они часто сильно зависят от типа задач и требований ПО к аппаратным ресурсам. Где-то это важно с точки зрения учета ресурсов, где-то — поможет определить, какой уровень производительности реальной системы необходим, чтобы добиться нужного уровня производительности от виртуальной системы. Наконец, есть пограничные типы задач, которые могут решаться с помощью как виртуальных, так и реальных систем — и там вопрос потерь может оказаться решающим фактором.
Методика тестирования
Для тестирования использовался набор тестовых приложений из обычной методики исследования производительности платформ IXBT.com от 2011 года, с некоторыми оговорками. Во-первых, из набора были убраны все игры, т. к. виртуальный графический адаптер с драйвером Oracle обладает слишком слабой производительностью: в большинстве случаев игры даже не запускались. Во-вторых, убраны приложения, которые стабильно не могли завершить тестовый сценарий на одной из конфигураций — это Maya, Paintshop Pro, CorelDraw. По этой причине нельзя сравнивать итоговые рейтинги и суммарный балл производительности нашего тестового стенда с базой протестированных процессоров. Однако сравнение результатов отдельных тестов вполне корректно.
Также нужно учитывать, что в методике используются версии приложений от 2011 года. Они могут не поддерживать новые технологии, оптимизации и наборы инструкций, внедренные после этого времени. При этом наличие такой поддержки в более новых версиях приложений может существенно влиять на производительность этих приложений — и в реальной, и в виртуальной системе.
Тестовый стенд
Для тестирования мы взяли систему с конфигурацией, подходящей на роль как сервера, так и высокопроизводительной рабочей станции. В будущих материалах мы проверим на ней возможности виртуализации с разными хост-системами. Сегодня в качестве хоста используется Windows 7.
- Процессор: Intel Xeon E3-1245 v3
- Материнская плата: SuperMicro X10SAE
- Оперативная память: 4 × Kingston DDR3 ECC PC3-12800 CL11 8 ГБ (KVR16LE11/8)
- Жесткий диск: Seagate Constellation ES.3 1 ТБ (ST1000NM0033)
- Операционная система: Windows 7 x64
ПО для виртуализации
В этом материале тестирование проводится с использованием Oracle VM VirtualBox.
Oracle VM VirtualBox — это бесплатная виртуальная машина (ВМ), распространяющаяся по лицензии GNU GPL 2. Она поддерживает обширный список операционных систем: Windows, OS X, Solaris и большое количество Linux-дистрибутивов (Ubuntu, Debian, openSUSE, SUSE Linux Enterprise Server, Fedora, Mandriva, Oracle Linux, Red Hat Enterprise Linux, CentOS). Изначально ВМ разрабатывалась Innotek, которая впоследствии была куплена Sun Microsystems, а в 2010 году — Oracle. ВМ поддерживает проброс USB-устройств в гостевую ОС, обеспечивает доступ в интернет и подключение удаленного рабочего стола. Гостевые ОС могут быть как 32-битными, так и 64-битными. Система поддерживает аппаратное ускорение 2D и 3D, а также PAE/NX, VT-x, AMD-V, Nested Paging. Эмулирует широкий спектр распространенных устройств: чипсет PIIX3 или ICH9, контроллеры IDE PIIX3,PIIX4, ICH6, аудиокарт Sound Blaster 16, AC97 или Intel HD, а также сетевых карт PCnet PCI II (Am 79 C 970 A), PCnet — Fast III (Am 79 C 973), Intel PRO /1000 MT Desktop (82540 EM), Intel PRO /1000 T Server (82543 GC), Intel PRO /1000 MT Server (82545 EM). Поддерживает образы жестких дисков VDI, VMDK, VHD, позволяет создавать общие папки для гостевой и хост-ОС, а также сохранять состояния ВМ.
У Oracle существует более серьезный аналог VM VirtualBox, Oracle VM Server для процессоров х86 и SPARC , базирующийся на гипервизоре Xen. Т. е., это совершенно другой продукт для другого сегмента рынка. Oracle VM Server поддерживает до 160 потоков на физическом сервере и до 128 виртуальных CPU в гостевых ОС, а максимальный объем ОЗУ — 4 ТБ, в то время как VM VirtualBox поддерживает лишь 32 виртуальных CPU для гостевой ОС и 1 ТБ ОЗУ.
Подводя итог, можно охарактеризовать VM VirtualBox как ВМ для домашнего использования и для использования в маленьких фирмах, а простота настройки (по сути установил и всё работает) не требует высокой квалификации у системного администратора (или вообще не требует выделенного системного администратора по причине простоты использования). Продукт же Oracle VM Server предназначен для более крупного бизнеса — он предоставляет и бо́льшую функциональность, и поддержку более мощных серверов, но требует и более высокой квалификации от системного администратора.
Настройки ПО
Для этого тестирования на тестовый стенд с ОС Windows 7 x64 была установлена ВМ Oracle VM VirtualBox, на которую был развернут образ Windows 7 x64 с тестовым пакетом приложений. В следующих материалах мы попробуем, как работают другие хост-ОС и ПО для виртуализации.
Сама виртуальная машина сконфигурирована следующим образом: включена поддержка Nested Paging, VT-x, PAE/NX, 3D- и 2D-ускорение. Для нужд ВМ выделено 24 Гб ОЗУ и 256 Мб под видеопамять.
Сравнение с Intel Core 7-4770k
Для сравнительной оценки общей производительности тестовой платформы на базе Intel Xeon E3-1245 v3 в таблицах также присутствуют результаты процессора Intel Core i7-4770K из тестирования на iXBT.com. Это позволяет примерно соотнести уровень производительности одного из топовых потребительских процессоров для ПК и серверного процессора Xeon, плюс дает много других интересных возможностей сравнения исходя из разницы в конфигурациях. Правда, тут нужно учитывать, что параметры двух систем немного отличаются, и это оказывает влияние на результаты. Сведем в таблицу характеристики стендов.
Intel Xeon E3-1245 v3 | Intel Core i7-4770K | |
Количество ядер/потоков, шт. | 4/8 | 4/8 |
Базовая/Boost частота, МГц | 3,4/3,8 | 3,5/3,9 |
Объем кэша L3, МБ | 8 | 8 |
Используемая оперативная память в тестовом стенде | 4 × Kingston KVR16LE11/8 | 4 × Corsair Dominator Platinum CMD16GX3M4A2666C10 |
Количество каналов, шт. | 2 | 2 |
Частота функционирования, МГц | 1600 | 1333 |
Тайминги | 11-11-11-28 | 9-9-9-24 |
ECC | да | нет |
Объем модуля, ГБ | 8 | 4 |
Суммарный объем, ГБ | 32 | 16 |
Графическая карта | Intel P4600 | Palit GeForce GTX 570 1280 МБ |
Core i7-4770k имеет рабочие частоты на 100 МГц выше, что может дать ему некоторое преимущество. С оперативной памятью ситуация сложная: с одной стороны, у Core i7-4770k вдвое меньше объем и ниже частота работы, 1333 МГц против 1600; с другой, у платформы Xeon память имеет более высокие тайминги, а также используется коррекция ошибок ECC.
Наконец, в системе Core i7-4770k установлена внешняя видеокарта Palit GeForce GTX 570 1280 МБ. В тестовой методике образца 2011 года лишь несколько приложений могут задействовать ресурсы графической карты, и в этих приложениях следует ожидать существенного превосходства системы с Core i7-4770k. К тому же, внешняя карта не конкурирует с процессором за доступ к ОЗУ, как это делает интегрированная Intel P4600, что тоже должно давать Core i7-4770k определенное преимущество. С другой стороны, в драйверах Р4600 должны присутствовать определенные оптимизации, позволяющие поднять производительность профессиональных приложений. Однако для них наверняка требуется и оптимизация самого ПО, так что в нашем тестировании (напомню, у нас используются версии приложений 2011 года) эти оптимизации, скорее всего, не заработают. А в жизни придется проверять каждый случай отдельно, ибо оптимизация ПО — это очень тонкий процесс.
Конфигурации, участвующие в тестировании
На реальной системе тестовый пакет запускался в двух конфигурациях: с отключенной и включенной технологией Intel Hyperthreading (далее НТ). Это позволяет оценить ее влияние на производительность и реальных, и виртуальных систем — а заодно и понять, где можно использовать младшую модель Intel Xeon этого поколения, у которого НТ нет. Виртуальная машина запускалась в двух конфигурациях: под 4 вычислительных ядра и под 8. В итоге мы получаем следующие конфигурации:
- Реальная система без HT (обозначается hw wo/HT)
- Реальная система с HT (обозначается hw w/HT)
- Виртуальная машина с 4 ядрами на 4-ядерном процессоре без НТ (обозначается vm 4 core wo/HT)
- Виртуальная машина с 4 ядрами на 4-ядерном процессоре с НТ (обозначается vm 4 core w/HT)
- Виртуальная машина с 8 ядрами на 4-ядерном процессоре с НТ (обозначается VM 8 core)
Для удобства сведем всё в таблицу.
Конфиг 1 | Конфиг 2 | Конфиг 3 | Конфиг 4 | Конфиг 5 | |
Название | Real wo/HT | Real w/HT | VM 4 core wo/HT | VM 4 core w/HT | VM 8 core |
Обозначение на графиках | hw 4/4, vm 4 core | hw 4/8, vm 4 core | hw 4/8, vm 8 core | ||
Количество ядер/ потоков на реальной системе | 4/4 | 4/8 | 4/4 | 4/8 | 4/8 |
количество ядер VM | - | - | 4 | 4 | 8 |
Расчет издержек виртуализации
Важно обратить внимание, что издержки виртуализации измеряются не относительно общего уровня, а в сравнении схожих аппаратных и виртуальных конфигураций.
Величина издержек виртуализации для 8-ядерной ВМ будет считаться относительно Intel Xeon E3-1245 v3 с включенной технологией HT (Real w/HT), а 4-ядерной ВМ — относительно Intel Xeon E3-1245 v3 без HT (Real wo/HT). Издержки экспериментальной конфигурации 4-ядерной ВМ на 8-поточном процессоре будут считаться относительно Intel Xeon E3-1245 v3 без HT.
Также в рамках тестирования будет введен рейтинг производительности, где за 100 баллов принята производительность Intel Xeon E3-1245 v3 без HT.
Приемлемый уровень потерь
Самый интересный вопрос — какой уровень потерь производительности стоит считать допустимым? В теории, уровень в 10-15 процентов представляется нам вполне приемлемым, учитывая те плюсы, которые дает предприятию виртуализация. Особенно учитывая, что повышается средний уровень загрузки оборудования и сокращается время простоя.
На первом этапе мы решили посмотреть, насколько упадет производительность при переходе на виртуальную систему в синтетическом тесте. Для этого мы взяли относительно простой бенчмарк Cinebench R15, который, однако, неплохо определяет уровень производительности центрального процессора в расчетах, связанных с трехмерным моделированием.
Real w/HT | VM 8 core | Real wo/HT | VM 4 core | |
Single Core | 151 | 132 (−13%) | 151 | 137 (−9%) |
Many Core | 736 | 668 (−9%) | 557 | 525 (−6%) |
4-поточная конфигурация имеет меньшую производительность, но и потери в процентах у нее также меньше — как в однопоточной нагрузке, так и в многопоточной. Что касается производительности ВМ, то, несмотря на большие потери, 8-ядерная конфигурация оказывается все равно быстрее 4-ядерной. Также можно предположить, что т. к. графический адаптер эмулируется драйвером Oracle, то наличие какой-либо нагрузки на графическую подсистему должно значительно увеличивать издержки для виртуальных систем, т. к. создает дополнительную нагрузку на процессор.
Ну а в целом пока будем ориентироваться на эти цифры — около 10% потери производительности для 8-поточной конфигурации и порядка 6% для 4-поточной.
Исследование производительности
Интерактивная работа в трехмерных пакетах
При интерактивной работе в некоторых приложениях CAD активно используется графическая карта, что будет серьезно влиять и на результаты, и на разницу в производительности между реальной и виртуальной системой.
CAD CreoElements
В режиме интерактивной работы в CAD CreoElements потери при виртуализации составляют внушительные 64%, причем для всех конфигураций. Скорее всего, из-за того, что в реальной системе задействуются ресурсы видеокарты, а в виртуальной нагрузка ложится на центральный процессор через драйвера Oracle.
В следующей таблице сведены как рейтинги, так и абсолютные результаты производительности для конкретного теста. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | Intel Core i7-4770K+GTX570 | |
Результаты | 562 | 1559 | 1536 | 584 | 1635 | 698 |
Рейтинг производительности | 100 | 36 | 37 | 96 | 34 | 81 |
Интересно отметить, что i7-4770K показывает меньшую производительность, чем Xeon, даже несмотря на использование достаточно мощной дискретной видеокарты. (С. И. — обещанные Intel оптимизации драйверов в серии профессиональных ускорителей P4600/P4700?)
CAD Creoelements | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −4% | −5% |
Технология HT негативно сказывается на производительности как реальной системы, так и ВМ — 4% и 5% потерь соответственно.
CAD SolidWorks
В SolidWorks картина, в целом, не меняется — издержки переходят все разумные границы, показывая более 80% потери производительности. Правда, в ассиметричной конфигурации (CPU: 4 ядра, 8 потоков; ВМ: 4 ядра) издержки заметно меньше, чем в двух других конфигурациях. Возможно, это объясняется работой фоновых процессов в хост-ОС: т. е. активация НТ удваивает количество возможных потоков до 8, где 4 выделяются ВМ, а 4 остаются в распоряжении хост-ОС.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 104,11 | 611 | 372,35 | 105,31 | 672,11 | 41,14 |
Рейтинг производительности | 100 | 17 | 28 | 99 | 15 | 253 |
Десктопный 4770K значительно быстрее Xeon (скорее всего, благодаря тому, что Solidworks умеет задействовать в этом сценарии ресурсы графической карты — С. К.). В целом, огромные издержки обусловлены тем, что SolidWorks требователен к графической подсистеме, а, как уже было выше сказано, виртуальная графическая карта лишь сильнее нагружает процессор.
CAD SolidWorks | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −1% | −9% |
Активация НТ приводит к снижению производительности — для физического сервера это 1%, а для ВМ — 9%. Что, в целом, подтверждает гипотезу о фоновых процессах — поскольку 8-ядерная ВМ "захватывает" все 8 потоков ЦП, хост-ОС и ВМ начинают конкурировать за ресурсы.
Итог по группе
Издержки виртуализации в данной группе приложений весьма значительны (более 60%), причем в обоих исследованных пакетах. При этом CAD CreoElements имеет меньшие издержки, чем SolidWorks, но последний еще и умеет задействовать ресурсы графической карты, т. е. на реальной системе может получать дополнительные бонусы. Технология HT не приносит пользы на физическом сервере, а на ВМ и вовсе снижает производительность в обоих пакетах. В целом, очень высокие потери производительности не позволяют рекомендовать виртуальные системы для работы с пакетами трехмерного моделирования. Впрочем, стоит еще посмотреть на финальный рендеринг.
Финальный рендеринг трехмерных сцен
Скорость финального рендеринга трехмерных сцен зависит от производительности центрального процессора, так что здесь картина должна получиться более объективной.
3Ds Max
Первое, на что стоит обратить внимание: при финальном рендеринге 3Ds Max показывает значительно меньшие издержки виртуализации, чем при интерактивной работе в CAD — 14% для 4-ядерной ВМ и 26% — 8-ядерной. Тем не менее, уровень издержек значительно выше установленных планок 6 и 10 процентов.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 6:38 | 7:43 | 7:51 | 5:15 | 7:04 | 5:07 |
Рейтинг производительности | 100 | 86 | 85 | 126 | 94 | 130 |
В целом, несмотря на достаточно высокие издержки, 8-ядерная ВМ имеет сопоставимый уровень производительности с 4-ядерными 4-поточными процессорами Intel, что весьма неплохо.
3Ds Max | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 26% | 9% |
Активация HT на реальном железе позволяет сократить время рендеринга на 26% — весьма достойный результат! Что касается НТ на ВМ, то здесь всё скромнее — всего 9% прироста. Тем не менее, прирост есть, и заметный.
Lightwave
Lightwave и вовсе показывает отличный результат: издержки виртуализации находятся на уровне 3% для 4-ядерной ВМ и 6% для 8-ядерной ВМ. Как видите, даже в одной группе приложения, предназначенные, в принципе, для одной и той же задачи, ведут себя по-разному: например, 3Ds Max показывает значительно большие издержки, чем Lightwave.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 5:28 | 5:38 | 5:40 | 5:12 | 5:33 | 4:45 |
Рейтинг производительности | 100 | 97 | 96 | 105 | 98 | 115 |
Десктопный 4770К показывает большую производительность, чем Xeon E3-1245v3. Стоит заметить, что 8-ядерная ВМ практически не уступает 4-ядерному 4-поточному физическому серверу. (Такое впечатление, что Lightwave плохо оптимизирован, поэтому меньше реагирует на любые изменения конфигурации. Что уменьшение производительности при виртуализации, что появление дополнительных ресурсов при активации НТ… на все он реагирует слабее, чем 3DsMax — С. К.).
Lightwave | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 5% | 9% |
Зато активация HT дает всего 5%-ую прибавку к скорости для реального железа и, что странно, 9%-ую для ВМ.
Итог
При финальном рендеринге трехмерных сцен, задействующем только ресурсы центрального процессора, издержки виртуализации вполне приемлемые, особенно у Lightwave, где потери производительности и вовсе можно охарактеризовать, как незначительные. Активация НТ и в 3Ds Max, и в Lightwave позволила повысить производительность и на физической, и на виртуальной системе.
Упаковка и распаковка
Ключевую роль в производительности архиваторов играет связка процессора и памяти. Также стоит отметить, что разные архиваторы по-разному оптимизированы, т. е. могут по-разному задействовать ресурсы процессора.
7zip pack
Издержки при сжатии данных составляют 12% для любой системы. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 1:14 | 1:24 | 1:24 | 0:59 | 1:07 | 0:59 |
Рейтинг производительности | 100 | 88 | 88 | 125 | 110 | 125 |
Xeon E3-1245v3 и i7-4770K показывают идентичные результаты — при чуть отличающейся частоте и разной памяти. Благодаря высокому приросту от активации НТ, виртуальная система с 8 ядрами обгоняет реальную с четырьмя.
7zip pack | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 25% | 25% |
Впрочем, прирост скорости сжатия от активации HT установился на 25% как для реального железа, так и для ВМ.
7zip unpack
В силу небольшого по объему тестового архива, результаты ВМ и реального сервера находятся на одном и том же уровне в рамках погрешности, так что реально оценить издержки не представляется возможнымПосмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 0:07 | 0:09 | 0:09 | 0:07 | 0:09 | 0:07 |
Рейтинг производительности | 100 | 78 | 78 | 100 | 78 | 100 |
Интересно, можно ли рассматривать 22% как некие “чистые” потери ВМ?
7zip unpack | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 0% | 0% |
Это касается и оценки эффекта от активации НТ — всё-таки объем тестового задания образца 2011 года слишком мал для современного 4-ядерного процессора.
RAR pack
У RAR издержки заметно выше, так еще и растут для 8-ядерной ВМ. В целом, 25% — все-таки многовато. Но RAR имеет довольно плохую оптимизацию в том числе под многопоточность.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 1:01 | 1:14 | 1:15 | 1:02 | 1:23 | 1:01 |
Рейтинг производительности | 100 | 82 | 81 | 98 | 73 | 100 |
Активация HT приводит к замедлению, но имея в виду посредственную реализацию многопоточности в WinRAR 4.0 это не удивительно.
RAR pack | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −2% | −11% |
Из-за значительных потерь от активации НТ 8-ядерная ВМ оказывается даже медленнее 4-ядерной.
RAR unpack
Поскольку тестовый архив Методики для современного процессора мал, время выполнения задания слишком мало, чтобы говорить о какой-либо точности. Тем не менее, можно точно сказать, что издержки относительно высоки. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 0:32 | 0:38 | 0:38 | 0:32 | 0:40 | 0:32 |
Рейтинг производительности | 100 | 84 | 84 | 100 | 80 | 100 |
Как видно, разница в процентах внушительная, а в реальности — всего лишь несколько секунд.
RAR unpack | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 0% | −5% |
Также можно точно сказать, что WinRAR плохо переваривает HT.
Итог
Производительность и издержки в этой группе очень сильно зависят от архиватора, от его оптимизации и способности эффективно использовать доступные ресурсы процессора. Поэтому и сложно давать рекомендации по поводу использования в ВМ — это в большей степени зависит от приложения, а не от типа задач. Тем не менее, 7zip демонстрирует, что уровень издержек при упаковке может быть относительно небольшим, и использовать этот архиватор в виртуальных машинах вполне можно.
Кодирование аудио
Эта группа объединяет в себе несколько аудиокодеков, работающих через оболочку dBpoweramp. Скорость кодирования аудио зависит от производительности процессора и от количества ядер. Этот тест также очень хорошо масштабируется на большее количество ядер, так как многопоточность в приложении реализована путем параллельного запуска кодирования нескольких файлов. Поскольку кодирование с помощью разных кодеков создает практически одинаковую нагрузку на систему и, соответственно, показывает близкие результаты, то мы решили свести все результаты в одну общую таблицу.
Итак, общие издержки виртуализации.
Кодирование аудио — вот идеал с точки зрения издержек виртуализации. Для 4-ядерной ВМ средние издержки составили всего 4%, а для 8-ядерной — 6%. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | ||
Apple | Результаты | 295 | 283 | 281 | 386 | 362 | 386 |
Apple | Рейтинг производительности | 100 | 96 | 95 | 131 | 123 | 131 |
FLAC | Результаты | 404 | 387 | 383 | 543 | 508 | 551 |
FLAC | Рейтинг производительности | 100 | 96 | 95 | 134 | 126 | 136 |
Monkey Audio | Результаты | 299 | 288 | 282 | 369 | 348 | 373 |
Monkey Audio | Рейтинг производительности | 100 | 96 | 94 | 123 | 116 | 125 |
MP3 | Результаты | 185 | 178 | 175 | 243 | 230 | 249 |
MP3 | Рейтинг производительности | 100 | 96 | 95 | 131 | 124 | 135 |
Nero AAC | Результаты | 170 | 163 | 161 | 229 | 212 | 234 |
Nero AAC | Рейтинг производительности | 100 | 96 | 95 | 135 | 125 | 138 |
OGG Vorbis | Результаты | 128 | 124 | 123 | 167 | 159 | 171 |
Nero AAC | Рейтинг производительности | 100 | 97 | 96 | 130 | 124 | 134 |
Как видите, хотя реальные результаты для разных кодеков отличаются, но если брать проценты, то они удивительно похожи. Core i7-4770k часто оказывается чуть быстрее (видимо, роль играет более высокая частота). Также интересно отметить, что результаты теста 4-ядерной ВМ на системе с активированным НТ всегда чуть ниже, чем без него. Вероятно, это следствие как раз работы НТ. Но в целом, разница в производительности в 3-5% между реальной и виртуальной системой — это очень хороший показатель.
Отдельно посмотрим, что добавляет активация НТ.
Кодирование аудио | Real w/HT | hw 4/8 vm 8 |
Apple | 31% | 28% |
FLAC | 34% | 31% |
Monkey Audio | 23% | 21% |
MP3 | 31% | 29% |
Nero AAC | 35% | 30% |
OGG Vorbis | 30% | 28% |
Активация технологии HT позволяет увеличить скорость на 31% на реальном сервере и на 28% на виртуальном. Также один из лучших результатов. Наконец, сводная таблица результатов.
Компиляция
Скорость компиляции также зависит не только от частоты и производительности ядра, но и от их количества.
GCC
Компилятор GCC показывает самые низкие издержки виртуализации среди прочих участников на четырехядерной системе, 13%. Правда, для 8-ядерной ВМ они серьезно растут и становятся уже слишком высоки — 26%.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 8:28 | 9:49 | 9:53 | 6:49 | 9:11 | 6:43 |
Рейтинг производительности | 100 | 86 | 86 | 124 | 92 | 126 |
Производительность серверного Xeon сопоставима с десктопным i7. 8-ядерная ВМ не дотягивает до физической системы с отключенным НТ.
GCC | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 24% | 7% |
Ощутимый прирост производительности происходит при активации НТ на физическом сервере — 24%, а вот на ВМ увеличение количества ядер позволяет поднять производительность лишь на 7%. Хотя и это тоже неплохо.
ICC
Компилятор Intel демонстрирует несколько большее падение производительности при виртуализации, чем GCC — 19% и 33% для 4-ядерной и 8-ядерной ВМ соответственно.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 12:59 | 16:01 | 16:06 | 8:32 | 12:43 | 8:20 |
Рейтинг производительности | 100 | 81 | 81 | 152 | 102 | 156 |
Производительность Xeon сопоставима с i7, а производительность 8-ядерной ВМ — с Xeon wo/HT. И заодно видно, какой внушительный прирост дает активация НТ. Все-таки продукт Intel, так что в том, что его постарались унифицировать под НТ, нет ничего странного. В цифрах это выглядит вот так:
ICC | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 52% | 26% |
Активация НТ позволяет получить намного больший прирост как на физическом сервере, так и на ВМ — 52% и 26% соответственно.
MSVC
Компилятор от Microsoft показал самые большие издержки — 37% для 4-ядерной ВМ и 62% для 8-ядерной, что не позволяет рекомендовать его для использования в виртуальных серверах.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 5:44 | 9:09 | 8:21 | 4:26 | 11:33 | 4:24 |
Рейтинг производительности | 100 | 63 | 69 | 129 | 50 | 130 |
Можно оценить и разницу во времени, которое потребовалось для выполнения задания. Так тоже вполне наглядно.
MSVC | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 29% | −26% |
Что касается НТ, то ее активация на реальной системе позволяет поднять скорость аж на 29%, тогда как в виртуальной системе наблюдается примерно такое же снижение производительности. Стоит также заметить, что асимметричная конфигурация ВМ с 4 ядрами на 8-поточном процессоре показывает меньшие издержки, чем симметричная, однако на 8-ядерной ВМ виден внушительный рост издержек.
В общем, этот компилятор на ВМ работает со слишком большими потерями производительности.
Итого
GCC демонстрирует приемлемый уровень издержек, ICC — побольше, но с ними еще можно мириться. Компилятор от Microsoft на виртуальных системах работает очень медленно. Зато все участники этой группы демонстрируют хороший прирост производительности при активациии НТ — кроме MSVC в виртуальной системе.
Математические и инженерные расчеты
За исключением MATLAB, данная группа тестов не имеет как таковых многопоточных оптимизаций.
Maple
Математические и инженерные расчеты в Maple показывают вполне приемлемый уровень издержек — 11%.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 0,6762 | 0,6041 | 0,6002 | 0,6656 | 0,5906 | 0,6854 |
Рейтинг производительности | 100 | 89 | 89 | 98 | 87 | 101 |
8-ядерная ВМ чуть медленнее, чем четырехядерные. Но в целом результаты виртуальных систем неплохие.
Maple | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −2% | −2% |
Прироста производительности от активации НТ ни на реальном железе, ни на ВМ нет, есть небольшое падение производительности, причем одинаковое.
Matlab
В Matlab издержки виртуализации растут, и если на 4-ядерной конфигурации это те же 11%, то для 8-ядерной ВМ они составляют уже 19%.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 0,0228 | 0,0256 | 0,0262 | 0,0235 | 0,029 | 0,0234 |
Рейтинг производительности | 100 | 89 | 87 | 97 | 79 | 97 |
В отличие от предыдущего сценария, 8-ядерная ВМ заметно отстает от 4-хядерных вариантов. Кстати, и 4770к тут медленнее, чем Xeon. Ну и видно, что с активацией НТ все не очень хорошо.
Matlab | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −3% | −12% |
Активация НТ приводит к снижению скорости, но если на реальной системе снижение практически незаметно, то на ВМ — более чем.
Creo Elements (CPU)
CreoElements показывает себя хуже всех — самые большие издержки.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 270 | 344 | 344 | 275 | 364 | 270 |
Рейтинг производительности | 100 | 78 | 78 | 98 | 74 | 100 |
Причем все варианты ВМ показывают схожую производительность, хотя 8-ядерный вариант чуть позади.
Creo Elements (CPU) | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −2% | −5% |
От НТ нет никакой пользы, только вред — 2% для физического сервера и 5% для виртуального.
SolidWorks (CPU)
SolidWorks показывает заметное падение производительности в виртуальных системах, причем для 8-ядерной ВМ они еще и заметно больше.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 27,09 | 33,17 | 32,28 | 27,12 | 34,89 | 19,19 |
Рейтинг производительности | 100 | 82 | 84 | 100 | 78 | 141 |
Солидная производительность Core i7-4770k объясняется присутствием внешней графической карты.
SolidWorks (CPU) | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 0% | −5% |
На физический сервере SolidWorks никак не реагирует на активацию НТ, а на ВМ реакция есть, но негативная — 5%-ое снижение производительности.
Итого
Уровень издержек в данной группе зависит от используемого приложения: минимальные у Maple, максимальные у CreoElements. В целом, математические расчеты можно с оговорками рекомендовать к виртуализации.
Растровая графика
AСDSee
В силу слабой оптимизации или по другим причинам, но потери производительности в виртуальных системах у ACDSee огромны. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 13:32 | 23:17 | 24:04 | 11:07 | 23:10 | 10:53 |
Рейтинг производительности | 100 | 58 | 56 | 122 | 58 | 124 |
С такой разницей во времени выполнения тестовых сценариев рекомендовать это приложение для использования на виртуальной машине не поднимется рука.
AСDSee | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 22% | 1% |
Если на реальном железе активация НТ позволяет поднять планку производительности на 22%, то с виртуализацией этот фокус не проходит — только 1%.
GIMP
GIMP демонстрирует чуть меньшие, но все равно недопустимуо большие издержки — 36% для 4-ядерной ВМ и 42% для 8-ядерной.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 10:57 | 17:12 | 17:49 | 10:46 | 18:28 | 10:38 |
Рейтинг производительности | 100 | 64 | 61 | 102 | 59 | 103 |
Взгляд не реальные цифры времени выполнения тоже навевает грусть.
Ну и результаты включения Hyperthreading:
GIMP | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 2% | −7% |
На физическом сервере наблюдается небольшое ускорение на уровне 2%, а на ВМ напротив — снижение скорости на 7%.
Imagemagick
На 4-ядерной ВМ уровень издержек Imagemagick вполне приемлем, а вот в конфигурации с 8-ядерной ВМ — высокий. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 1:47 | 2:01 | 2:03 | 1:51 | 2:35 | 1:49 |
Рейтинг производительности | 100 | 88 | 87 | 96 | 69 | 98 |
Результаты виртуальных систем неплохие, только не стоит использовать 8-ядерную конфигурацию. Что интересно, 4770К и система с НТ немного отстают от референсной системы, т. е. активация НТ ухудшает ситуацию.
Imagemagick | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −4% | −22% |
При ее включении ухудшаются показатели и реальной системы, но вот виртуальная вообще проваливается.
Photoshop
У Photoshop ситуация примерно такая же, как в предыдущем случае: относительно небольшие, на уровне 15%, издержки на 4-ядерной ВМ и очень большие, 30% — на 8-ядерной. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 1:47 | 2:05 | 2:09 | 1:46 | 2:29 | 1:45 |
Рейтинг производительности | 100 | 86 | 83 | 101 | 72 | 102 |
Работать в виртуальной системе более-менее можно, если она 4-хядерная.
Photoshop | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 1% | −16% |
Активация НТ практически не приносит дивидендов на реальной системе, а производительность ВМ ухудшает аж на 16%.
Итого
Стоит оговориться, что в большинстве приложений речь идет о пакетной обработке файлов. Т. к. время обработки одного файла относительно невелико, существенная часть времени тратится на операции чтения/записи, которые в случае виртуальной системы создают дополнительную нагрузку на процессор и приводят к дополнительным потерям времени (Виртуальный жесткий диск представляет собой образ, хранящийся на физическом жестком диске — а это еще один посредник непосредственно между приложением и железом).
Что же до выводов, то практически все приложения для работы с растровой графикой плохо реагируют на активацию НТ в виртуальных машинах, а ее активация на реальной системе проходит незамеченной. Производительность на 4-хядерной ВМ зависит от приложения: у двух из четырех приложений издержки активации относительно невысоки, и использовать эти приложения в ВМ можно. А вот задавать 8 ядер в настройках не стоит — вместо роста производительности получите существенное ее ухудшение. В целом же, программы для обработки изображений придется пробовать, чтобы индивидуально оценить производительность и ее падение в ВМ. Уровень издержек при переходе на виртуальную платформу для протестированных приложений нам кажется высоковатым.
Векторная графика
Данная группа является однопоточной, поэтому производительность будет зависеть только от производительности единичного ядра.
Illustrator
Примерно та же ситуация, что и в предыдущей группе — более-менее приемлемые издержки для 4-ядерных ВМ и большие потери производительности для 8-ядерной ВМ, Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 5:37 | 6:42 | 6:34 | 5:36 | 7:39 | 5:27 |
Рейтинг производительности | 100 | 84 | 86 | 100 | 73 | 103 |
Производительность E3-1245v3 сопоставима с 4770K — хотя последний несколько быстрее за счет 100 дополнительных мегагерц. Что же до общей картины… Падение в процентах выглядит не особо страшным, но в реальности может вылиться в заметные дополнительные потери времени.
Illustrator | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 0% | −12% |
И та же ситуация с НТ — никакого прироста от активации на реальной системе, заметное падение производительности на виртуальной. Впрочем, причину мы уже описали выше.
Кодирование видео
Нужно учитывать, что первые три участника — это полноценные графические пакеты, т. е. речь идет об интерактивной работе и последющем создании ролика. Тогда как остальные участники — это просто кодировщики.
Expression
С кодированием видео в Expression дело обстоит не очень хорошо — даже на 4-ядерных системах потери производительности под 20%, а у 8-ядерной — практически на треть. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 2:01 | 2:28 | 2:30 | 2:10 | 3:18 | 2:08 |
Рейтинг производительности | 100 | 82 | 81 | 93 | 61 | 95 |
Как видите, мощные процессоры с включенным НТ отстают от версии без него.
Expression | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −7% | −25% |
Активация НТ что на реальной, что на виртуальной системе только ухудшает производительность. Но на виртуальной падение очень большое.
Premiere
С Premiere ситуация заметно лучше — можно говорить о приемлемом уровне издержек для 4-ядерной ВМ. Для 8-ядерной ВМ они по-прежнему слишком велики. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 1:38 | 1:51 | 1:53 | 1:25 | 1:59 | 1:23 |
Рейтинг производительности | 100 | 88 | 87 | 115 | 82 | 118 |
Ну и посмотрим, что дает НТ.
Premiere | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 15% | −7% |
Premiere получает аж 15% прироста производительности на реальной системе. Это хороший результат, который говорит об оптимизации под многоядерность. Правда, на ВМ активация НТ приводит к потерям в 7%.
Vegas Pro
Vegas Pro показывает высокие издержки — 19% для 4-ядерных и недопустимые 32% для 8-ядерных ВМ.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 3:37 | 4:29 | 4:35 | 3:36 | 5:19 | 3:05 |
Рейтинг производительности | 100 | 81 | 79 | 100 | 68 | 117 |
Что интересно, в этом пакете Core i7-4770k показывает заметно более высокую производительность, чем на нашей тестовой системе.
Vegas Pro | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 0% | −16% |
Активация НТ не приносит никаких дивидендов на реальной системе, а на виртуальной показывает 16%-ое снижение производительности.
В общем, Vegas Pro, похоже, существенно менее оптимизирован под работу с современными процессорами и тратит их ресурсы неэффективно. Поэтому Premiere выглядит гораздо симпатичнее с точки зрения перспектив работы в виртуальной среде.
Ну а теперь давайте посмотрим, как ведут себя чистые кодировщики видео.
X264
Итак, х264 демонстрирует в целом терпимые издержки, причем, в кои-то веки 8-ядерная ВМ эффективнее 4-хядерных. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 4:46 | 5:38 | 5:26 | 4:43 | 5:15 | 4:39 |
Рейтинг производительности | 100 | 85 | 88 | 101 | 91 | 103 |
Производительность 8-ядерной ВМ всего лишь на 9% ниже, чем Xeon wo/HT.
X264 | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 1% | 7% |
Реальная система практически не реагирует на активацию НТ, а вот в виртуальной она позволяет поднять производительность на 7%.
xvid
4-ядерные ВМ и здесь демонстрируют низкий уровень издержек, около 10%. А вот 8-ядерная сильно провалилась. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 5:03 | 5:35 | 5:30 | 5:16 | 8:24 | 5:07 |
Рейтинг производительности | 100 | 90 | 92 | 96 | 60 | 99 |
Цифры, что называется, говорят сами за себя.
xvid | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −4% | −34% |
Увы, активация НТ приносит лишь вред. И если на физическом сервере потери незначительны — 4%, то на ВМ они достигают 34%. То есть, и Xvid и ВМ неэффективно оперируют логическими ядрами.
Итого
Итак, у видеоредакторов уровень потерь производительности зависит прежде всего от самого редактора, поэтому пригодность для работы в ВМ стоит оценивать индивидуально. В наших тестах (и для используемых нами версий продуктов) существенно лучше выступил Premiere.
Что же до кодировщиков, то хотя разница между ними есть, но в 4-хядерных ВМ они все показывают довольно неплохие результаты. Что же до использования 8-ядерных виртуальных машин, то тут можно получить как рост, так и серьезное падение производительности. Другой вопрос, что при принятии решения о запуске перекодирования видео на виртуальной машине надо всегда помнить, что современные процессоры и графика обладают широким спектром оптимизаций под этот класс задач (так же, как и ПО), а в ВМ Oracle Virtual Box работа будет осуществляться в программном режиме, т. е. и медленнее, и с большей загрузкой процессора.
Офисное ПО
Chrome
Chrome в тесте вел себя не совсем адекватно, поэтому относиться к результатам стоит с большой долей скепсиса. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 8216 | 13170 | 13113 | 13767 | 12133 | 15406 |
Рейтинг производительности | 100 | 160 | 160 | 168 | 148 | 189 |
И результаты от активации НТ.
Chrome | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 68% | −8% |
К данному подтесту в группе не стоит относится серьезно в силу этих обстоятельств.
Excel
MS Excel показывает издержки на уровне 15% и 21% для 4-ядерной и 8-ядерной ВМ. В принципе, уровень издержек можно назвать высоким. Хотя на практике пользователь вряд ли будет замечать замедление работы, разве что в каких-то очень сложных расчетах. У 8-ядерной системы издержки традиционно выше. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 11:33 | 13:37 | 13:51 | 11:39 | 14:42 | 11:18 |
Рейтинг производительности | 100 | 85 | 83 | 99 | 79 | 102 |
Тестовое задание для Excel занимает много времени, что позволяет наглядно продемонстрировать разницу во времени на его выполнение. Как видите, виртуальная система будет выполнять его на 2 минуты дольше.
И отдельно издержки от НТ:
Excel | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −1% | −7% |
Finereader
Издержки в Finereader средние для 4-хядерных систем и повыше для 8-ядерной. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 10:17 | 11:38 | 11:40 | 8:20 | 10:06 | 8:07 |
Рейтинг производительности | 100 | 88 | 88 | 123 | 102 | 127 |
За счет высокой эффективности НТ, 8-ядерной ВМ удается опередить физический сервер на базе Xeon wo/HT. Что интересно, 4770К показывает заметно более высокий результат.
Finereader | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 23% | 15% |
Finereader положительно откликается на НТ и показывает 23% и 15% прироста производительности для реального железа и ВМ соответственно.
Firefox
Уровень издержек совсем невысокий для 4-ядерных систем, чуть повыше для 8-ядерной. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 7422 | 6947 | 6836 | 7406 | 6495 | 7584 |
Рейтинг производительности | 100 | 94 | 92 | 100 | 88 | 102 |
И воздействие включения НТ
Firefox | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 0% | −7% |
На ВМ наблюдается некоторое снижение производительности при активации НТ.
IE
IE показывает несколько большие издержки, чем Firefox. Особенно в 8-ядерной ВМ.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 1218 | 1119 | 1074 | 1216 | 1010 | 1240 |
Рейтинг производительности | 100 | 92 | 88 | 100 | 83 | 102 |
Ну и издержки НТ:
IE | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 0% | −10% |
Активация НТ вредит ВМ, снижая производительность на 10%.
Opera
Opera демонстрирует чуть более высокие издержки, чем Firefox, и примерно на уровне Internet Explorer. Точно так же, для 8-ядерной ВМ их можно назвать высокими.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 7455 | 6778 | 6465 | 7378 | 6012 | 7492 |
Рейтинг производительности | 100 | 91 | 87 | 99 | 81 | 100 |
Отдельно — издержки НТ:
Opera | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −1% | −11% |
Толку от НТ никакого нет, напротив только вред — 11%-ое снижение производительности на ВМ.
PowerPoint
И здесь для 4-хядерных ВМ уровень издержек приемлемый — всего 10%. Для 8-ядерной машины он повыше, 14%, но в целом тоже ничего страшного. Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 0:44 | 0:49 | 0:49 | 0:44 | 0:51 | 0:43 |
Рейтинг производительности | 100 | 90 | 90 | 100 | 86 | 102 |
В силу небольшого времени выполнения тестового пакета, а следовательно, высокой погрешности, судить об эффективности НТ сложно.
PowerPoint | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 0% | −4% |
Word
Word несколько разочаровал — другие приложения из пакета MS Office работали на виртуальных машинах побыстрее. А здесь — 26% для 8-ядерной ВМ!
Word | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | −1% | −14% |
Активация НТ приводит к 14%-му снижению производительности на ВМ.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 1:07 | 1:19 | 1:19 | 1:08 | 1:32 | 1:06 |
Рейтинг производительности | 100 | 85 | 85 | 99 | 73 | 102 |
Итого
Самое главное, что стоит иметь ввиду — в большинстве случаев производительности современных систем будет хватать для всех офисных задач, скорее всего даже с запасом. А раз уровень производительности достаточный, то пользователя не будет интересовать, какие там издержки.
Java
Данный тестовый пакет интересен тем, что Java по сути является виртуальной машиной, а, следовательно, запуск Java на Oracle VM VirtualBox означает запуск виртуальной машины на виртуальной машине, что подразумевает двойное абстрагирование от аппаратного обеспечения. Именно поэтому стоит ожидать адекватных издержек — все основные потери производительности произошли на уровне переноса программного кода на Java.
Java
Издержки 8-ядерной ВМ установились на 8%, а 4-ядерной — 5%.Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 205,02 | 194,46 | 192,13 | 236,56 | 217,03 | 240,27 |
Рейтинг производительности | 100 | 95 | 94 | 115 | 106 | 117 |
За счет высокой эффективности НТ и невысоких издержек 8-ядерная ВМ показывает на 6% большую производительность, чем Xeon wo/HT. Прирост от НТ на реальном железе составил 16%, а на ВМ — 12%.
Java | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 15% | 12% |
Смотря на результаты Java, можно предположить, что виртуализация различных фреймворков и программ, написанных на языках программирования с трансляцией в свой байт-код, не будет иметь высоких издержек, так как все основные издержки "заложены" в них самих. То есть, повсеместное использование языков программирования с псевдокодом не такое уж и плохое явление, особенно для виртуальных машин.
Воспроизведение видео
Этот раздел следует рассматривать просто как иллюстрацию — т. к. на реальных системах используется DXVA, т. е. аппаратное ускорение — соответственно, нагрузка на процессор минимальна. В отличие от ситуации с ВМ, где все расчеты производятся программно. В итоговый балл он также не включен.
Напомню, здесь значение таблиц — это уровень загрузки процессора. Почему он бывает больше 100% — можно почитать в методике.
MPCHC (DXVA)
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 6 | 110 | 108 | 6 | 113 | 6 |
Это хорошая иллюстрация эффективности средств аппаратного ускорения, и при воспроизведении видео все очевидно. Но стоит помнить, что на современных системах примерно тех же результатов можно достичь и с помощью других оптимизаций — того же Qsync для работы с видео, СUDA для графических расчетов и т. д.
MPCHC (software)
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 68 | 70 | 72 | 68 | 72 | 54 |
А вот в софтверном режиме разница между физическим сервером и виртуальным невелика — 4%. Де-факто, издержки производительности незначительны.
VLC (DXVA)
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 12 | 61 | 61 | 11 | 66 | 13 |
Что интересно, в VLC загрузка процессора для ВМ существенно ниже, чем в MPC HC.
VLC (software)
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 52 | 61 | 62 | 51 | 66 | 51 |
В софт-режиме разницы между реальным железом и ВМ снова практически нет. Активация DXVA в виртуальной системе приводит лишь к дополнительной работе для процессора.
Многозадачное окружение
Издержки в многозадачном окружении составили 32% и 25% для 8-ядерной и 4-ядерной ВМ соответственно. 4-ядерная ВМ очень сильно провалилась, там издержки аж 67%. Почему такое происходит — сложно сказать (напомню, речь идет о стабильном результате при нескольких запусках). Посмотреть таблицу с результатами
Real wo/HT | VM 4 core wo/HT | VM 4 core w/HT | Real w/HT | VM 8 core | 4770K | |
Результаты | 6:59 | 9:17 | 21:24 | 6:08 | 9:00 | 13:43 |
Рейтинг производительности | 100 | 75 | 33 | 114 | 78 | 51 |
И что происходит при активации НТ
Multitasking | Real w/HT | hw 4/8 vm 8 |
Прирост от НТ | 14% | 3% |
Технология НТ в многозадачном окружении приносит свои плоды для реальной системы — 14% прироста, а вот ВМ всё значительно хуже — 3%.
Тестирование многозадачности — довольно тонкий процесс, на который влияет множество факторов. Поэтому делать однозначные выводы со сторпроцентной уверенностью сложно. Например, чем можно объяснить громадное падение производительности четырехядерной ВМ при активации НТ? Какими-то специфическими особенностями взаимодействия хост-ОС и ВМ? Или используемые в тесте приложения сильно теряют в производительности (а примеры выше мы видели) и в совокупности дают такой результат? Кстати, если последнее утверждение верно, то это хорошо показывает, что совокупные издержки от использования ВМ могут оказаться очень высокими.
Наконец, обратите внимание на производительность Core i7-4770k, который в этом тесте очень сильно отстал от нашего тестового стенда, хотя в отдельных задачах никаких провалов не допускал. В чем тут дело? Вероятно, причина падения производительности — своп из-за недостатка оперативной памяти, который проявляется только при запуске нескольких «тяжелых» приложений одновременно. Впрочем, не будем исключать и другие причины.
Средний балл
Это, конечно, средняя температура по больнице, но все же…
Средний балл | VM 4 core wo/HT | VM 8 core |
Издержки виртуализации | 17% | 24% |
Среднеарифметические издержки виртуализации по всем тестам составили 17% и 24% для 4-ядерной и 8-ядерной ВМ соответственно.
Средний балл | Real w/HT | VM 8 core |
Прирост от НТ | 12% | 0% |
Прирост от НТ составил 12% для физического сервера и 0% для ВМ.
И на этой мажорной ноте давайте переходить к выводам.
Выводы
На мой взгляд (С. К.) анализировать производительность и потери производительности для отдельных групп или приложений не стоит: в мире ПО все слишком изменчиво. Но можно отметить определенные тенденции.
Вывод первый: Hyperthreading не всегда помогает даже на реальной системе — иногда его активация приводит к некоторому снижению производительности. С виртуальными системами ситуация еще сложнее: 8-ядерная ВМ зачастую проигрывает по производительности 4-ядерной. Т. е. использовать связку «4 ядра + НТ на реальном процессоре» и 8-ядерная ВМ можно лишь для тех задач, где вы точно знаете, что результат такого решения будет в плюс, а не в минус. Впрочем, тут нужно помнить, что задача НТ была именно в том, чтобы улучшить производительность в многозадачном окружении и (как и у ВМ), стабилизировать нагрузку на процессор. Поэтому система в целом от активации НТ должна выигрывать всегда — особенно серверная.
Вывод второй: издержки при переходе на виртуальную машину зависят скорее не от типа задач, а от конкретного приложения. Более того, и эффективность использования того или иного приложения в виртуальной машине (ВМ), видимо, определяется тем, насколько его алгоритмы «ложатся» на особенности ВМ. Например, мы не можем точно определить, является ли большое падение производительности при работе с изображениями в ВМ следствием того, что этот класс задач вообще плохо «виртуализируется», или следствием того, что существующие приложения просто используют устаревшие алгоритмы, которые не оптимизируются, потому что на современных быстрых процессорах все и так хорошо работает.
Причем у меня есть серьезные подозрения, что этот тезис можно отнести ко всем приложениям, где издержки высоки — просто эти приложения плохо оптимизированы. Т. е. они и ресурсы реальных систем используют неэффективно, просто высокий уровень производительности современных процессоров позволяет не забивать себе этим голову. Этот тезис можно отнести к профессиональным приложениям для работы с трехмерной графикой, научным расчетам и некоторым другим отдельным приложениям.
В каких-то группах виртуализация дает относительно небольшие издержки — в первую очередь в глаза бросаются аудио- и видеокодирование. Как правило, речь идет о простой и стабильной нагрузке, связанной именно с вычислениями. Это подводит нас к следующему выводу.
Вывод третий: Сейчас основные проблемы у виртуальных машины начинаются тогда, когда реальная система может задействовать аппаратные оптимизации. В распоряжении реальной системы много разных технологий оптимизации: DXVA, OpenCL, QSync и других — которые позволяют снять нагрузку с центрального процессора и ускорить выполнение задачи. В виртуальной системе Virtual Box таких возможностей нет. Впрочем, набор инструкций VT-d позволяет пробрасывать PCI-устройства в виртуальную среду. Например, я (С. К.) видел профессиональное решение НР с видеоадаптерами Nvidia Grid 2, вычислительные ресурсы которых могут виртуализироваться. В общем, ситуация зависит от самой виртуальной машины, устройств, драйверов, систем и пр. Поэтому к этому вопросу мы еще обязательно вернемся.
Наконец, пару слов стоит сказать вот о какой вещи (хотя основные выводы мы прибережем до конца всех тестирований). Стоит ли высчитывать процент падения производительности, и на его основе решать, какие задачи подлежат виртуализации, а какие нет? Например, 20-процентное падение скорости работы — это много или мало?
С. К. На мой взгляд, так ставить вопрос не стоит и вот почему.Принятие решения о том, использовать или нет виртуальные системы, лежит в области организации бизнеса, а не в области технических аспектов. А плюсы с точки зрения бизнеса могут перевесить даже 50%-ное падение производительности. Но даже если посмотреть на отдельные и вроде бы ресурсоемкие задачи, то все не так очевидно. Например, перекодировка видеоролика или расчет трехмерной модели идет 30 минут, а на виртуальной — за 50. Казалось бы, вывод очевиден — использование реальной системы оптимальнее! Однако если сцена считается на рабочей станции пользователя, то это время он не может работать. А если ее можно сбросить на сервер и заниматься следующей (причем ее подготовка займет гарантированно больше 50 минут), то в целом эффективность работы вырастет. А если еще на сервере обсчитывается несколько сцен — пусть даже подряд и медленно — то все равно с точки зрения бизнеса (и при должном распраллеливании задач) выигрыш очевиден.
С. И. С другой стороны, очень часто сервер подбирается под определенный уровень производительности в целом или в определенных приложениях, и при этом в условиях очень ограниченного бюджета. Т. е. взять вариант помощнее и подороже «про запас» не получится. В этих условиях переход на виртуальную системы (и выбор ПО с высокими издержками) может привести к тому, что в результате сервер просто не будет справляться с высокими нагрузками и с возложенными на него задачами.
На этом мы завершаем это исследование производительности виртуальной системы с ОС Windows и Oracle VM VirtualBox. В следующем материале мы рассмотрим, насколько изменится производительность Windows 7 в ВМ, если в качестве хост-ОС выступает Linux.