Лучше поздно, чем никогда! — решили мы и довели до логического завершения (коим является собственно данная статья) тестирование семейства интегрированных чипсетов NVIDIA. Дополнительным информационным поводом стало пополнение линейки усеченными моделями, выполненными в одной микросхеме, состоявшееся прошедшей осенью (и платы на их основе лишь только начинают просачиваться в продажу).
NVIDIA GeForce 6100/6150 + nForce 410/430
Схема чипсета едва ли нуждается в расшифровке по всем пунктам, системные платы на его базе уже хорошо известны потребителям. За поддержку шины PCI-Express отвечает северный мост — доступен графический порт PCI Express x16 и один (GeForce 6100) или два (GeForce 6150) порта PCIEx1. Прочие отличия обеспечивает графическое ядро, которое у старшей модели работает на 475 МГц, у младшей — 425 МГц, также GeForce 6150 поддерживает DVI-выход, аппаратное ускорение декодирования HD Video, а GeForce 6100 этих возможностей лишен, и лишь в августе 2006 года со сменой ревизии получил простой ТВ-выход. Интригующее обозначение NVIDIA Quadro NVS 210S носит точная копия чипсета GeForce 6150, со сниженной до уровня GeForce 6100 частотой, сертифицированная в соответствии с требованиями AMD Commercial Stable Image Platform.
Для подключения южного моста используется стандартная шина — HT с частотой до 1 ГГц и разрядностью 16 бит (как правило, штатно используется максимальная частота, но поскольку такая пропускная способность заведомо избыточна, она может быть ограничена в BIOS производителем платы, и очень часто имеется возможность понизить частоту и разрядность вручную). Южный мост nForce 430 обеспечивает поддержку 4 SATA-II с возможностью организации RAID-массивов уровней 0, 1, 0+1 и 5, а nForce 410 — лишь двух портов и, соответственно, RAID-массивов уровней 0 и 1. В nForce 430 имеется MAC-адаптер Gigabit Ethernet с широко известной функциональностью NVIDIA Active Armour (программно-аппаратный брандмауэр с функцией «распаковки» TCP/IP-трафика силами чипсета), а в nForce 410 — Fast Ethernet без дополнительной функциональности. Обе версии поддерживают HD Audio, характерно, что изначально имелась и поддержка AC’97, но поставляемые с августа южные мосты nForce 430 поддерживают только HD Audio, что радует, поскольку лишает производителей недорогих плат соблазна сэкономить на аудио-кодеке. С поддержкой PATA дела изначально обстояли стандартным образом (два канала на четыре устройства), но, следуя общей тенденции, в обновленной ревизии nForce 430 оставлен только один канал.
NVIDIA GeForce 6100 + nForce 400/405
Пополнением семейства прошедшей осенью стала одночиповая версия GeForce 6100, фактически функциональность nForce 410 с минимальными урезаниями (один канал PATA вместо двух) перенесли в северный мост. Частота графического ядра осталась прежней, убрана поддержка ТВ-выхода и сокращено число линий PCI Express, в результате nForce 405 поддерживает PCI Express x8 для видеокарты, а nForce 400 вовсе не предполагает наличия графического порта. Полученные гибриды смотрятся очень неплохо, как по себестоимости, так и по экономичности (и, как демонстрируют тесты первых системных плат на старшей одночиповой модели, тепловыделение оказывается ниже, чем у отдельного северного моста GeForce 6100, очевидно, повлияло удаление части линий PCI Express). Возможно, NVIDIA следовало применить более логичное наименование — GeForce 6000/6050, например, коль скоро южного моста в этих чипсетах не имеется, а поддержка PCI Express и раньше относилась к северному мосту. Но это мелкие придирки, а в целом, надо признать, что у данного решения почти нет прямых конкурентов, до сих пор все распространенные интегрированные решения для платформы AMD64 являлись двухчиповыми, что отрицательно сказывалось на дизайне платы (требовало более сложной разводки) и в конечном счете мешало дальнейшему снижению цен.
Несколько слов нужно сказать о характеристиках графического ядра, оно поддерживает DirectX 9.0, технологию PureVideo (аппаратное ускорение декодирования H.264, VC-1 и MPEG-2 видео, постобработка HD-видео в разрешении до 1080p), имеет 2 пиксельных и 1 вершинный конвейер и работает на частоте 425 МГц (GeForce 6100) и 475 МГц (GeForce 6150). Поддерживается совместная работа интегрированного ядра и внешней видеокарты, что позволяет строить мультимониторную конфигурацию (до 4 мониторов, если плата основана на чипсете GeForce 6150 и имеет два видеовыхода). Любопытно, что у конкурирующего решения (Radeon Xpress 1150) наблюдается иной подход к построению графического ядра, имеется 4 пиксельных конвейера (поддержка вершинных шейдеров эмулируется драйвером, но выполняется центральным процессором), работающих на 333 МГц. Дополнительно отметим, что реальная частота может отличаться от номинальной и зависит от воли разработчиков системных плат, причем отличия могут быть весьма серьезными, что демонстрируют наши регулярные тестирования.
В завершение теоретического вступления приведем таблицу характеристик существующих на сегодня моделей семейства.
Наименование чипсета | частота графического ядра | PCI Express | поддержка HD Video, DVI, ТВ-выхода | аудио-поддержка | количество портов SATA | режимы RAID | количество каналов PATA | количество портов USB | MAC-адаптер Ethernet |
Quadro NVS 210S + nForce 430 | 425 | 1x16, 2x1 | + | HDA/AC’97 | 4 | 0, 1, 0+1, 5 | 2 | 8 | Gigabit |
GeForce 6150 + nForce 430 | 475 | 1x16, 2x1 | + | HDA/AC’97 | 4 | 0, 1, 0+1, 5 | 2 | 8 | Gigabit |
GeForce 6150 LE + nForce 430 | 425 | 1x16, 2x1 | + | HDA/AC’97 | 4 | 0, 1, 0+1, 5 | 2 | 8 | Gigabit |
GeForce 6150 SE + nForce 430 | 425 | 1x16, 2x1 | только DVI и ТВ-выход через sDVO | HDA/AC’97 | 4 | 0, 1, 0+1, 5 | 1 | 10 | Gigabit |
GeForce 6100 + nForce 430 (до авг. 2006) | 425 | 1x16, 1x1 | - | HDA/AC’97 | 4 | 0, 1, 0+1, 5 | 2 | 8 | Gigabit |
GeForce 6100 + nForce 430 (после авг. 2006) | 425 | 1x16, 1x1 | только ТВ-выход через sDVO | HDA | 4 | 0, 1, 0+1, 5 | 1 | 10 | Gigabit |
GeForce 6100 + nForce 410 | 425 | 1x16, 1x1 | - | HDA | 2 | 0, 1 | 2 | 8 | Fast |
GeForce 6100 + nForce 405 | 425 | 1x8, 2x1 | - | HDA | 2 | 0, 1 | 1 | 8 | Fast |
GeForce 6100 + nForce 400 | 425 | 2x1 | - | HDA | 2 | 0, 1 | 1 | 8 | Fast |
Исследование производительности
Тестовый стенд:
- Процессор: AMD Athlon 64 X2 4000+
- ОС: Windows XP SP2
- Материнские платы:
- ASUS M2NPV-VM на чипсете NVIDIA GeForce 6150 + nForce 430
- MSI K9NGM на чипсете NVIDIA GeForce 6100 + nForce 410
- ECS GeForce6100SM-M на чипсете NVIDIA GeForce 6100 + nForce 405
- MSI K9AGM на чипсете Radeon Xpress 1150
- Память: 2 модуля Kingston KHX7200D2K2/1G (DDR2-800, 5-5-5-15-1T)
- Внешнее видео: ATI Radeon X1900 XTX, 512 МБ GDDR3
- Жесткий диск: Seagate Barracuda 7200.10 (SATA-II, 7200 об/мин)
- БП: Chieftec CFT-560-A12C
Программное обеспечение:
- ОС и драйверы:
- Windows XP Professional SP2
- DirectX 9.0c
- ATI Catalyst 6.11
- NVIDIA ForceWare 93.71
- Тестовые приложения:
- 7-Zip 4.10b
- кодек XviD 1.0.2 (29.08.2004)
- Doom 3 (v1.0.1282)
- FarCry (v1.1.3.1337)
- Unreal Tournament 2004 (v3339)
- Windows Media Player 11
- CyberLink Video/SP Decoder 6.02.2086 из PowerDVD 7
- NVIDIA Video Decoder 4020.223.0.0
Результаты тестов
Исследование производительности при использовании внешней видеокарты достаточно провести на примере архиваторов (или других приложений, особенно чувствительных к производительности подсистемы памяти) и лишь с той целью, чтобы убедиться в отсутствии каких-либо упущений при настройке параметров BIOS плат, участвующих в тестировании.
Что и требовалось доказать. Впрочем, как показывают наши регулярные тестирования плат, даже отклонение на 5–7 секунд в данном тесте позволяет считать настройки BIOS равноценными, поскольку в остальных тестах при таком раскладе разницы не наблюдается вовсе. Исходя из этого, наблюдающееся снижение производительности при переходе на использование интегрированной графики (за счет дополнительной нагрузки на контроллер памяти в процессоре со стороны видеоядра), также можно назвать чисто символическим. На практике (разумеется, за исключением приложений, использующих функции обработки трехмерного изображения) влияние дополнительного видеотрафика выявить просто невозможно. Вероятно, именно это обстоятельство и объясняет нежелание производителей системных плат устанавливать отдельную память для видеонужд, в тех случаях, когда такая возможность предусмотрена чипсетом, как например, для Radeon Xpress 1150. Ну а сам факт минимального снижения производительности логично объяснить характерными особенностями архитектуры Direct Connect, как известно, в серверных системах на современных процессорах AMD доступ в оперативную память, подключенную к «соседнему» процессору, осуществляется через межпроцессорный канал Hyper-Transport и контроллер памяти, встроенный в «конечный» процессор. Вполне естественно, что если контроллер памяти (а он у серверных и настольных процессоров одинаков) проектируется с учетом такой нагрузки, обслуживание запросов интегрированной графики для него — легкая разминка. Надо отметить, что у видеобуфера есть возможность оказаться полезным в ноутбуках, где освобождение процессора от служебных задач (обновления данных в буфере кадра) полезно с точки зрения энергосбережения и возможности погружать процессор в более глубокие режимы спячки в простое.
Еще один чувствительный к эффективности работы с памятью тест — видеокодировщик XviD в условиях работы с интегрированной графикой демонстрирует незначительное отклонение результатов между чипсетами, однако, с учетом предыдущего теста, все же можно отметить, что рассматриваемые чипсеты NVIDIA чуть более экономичны в вопросах обмена с оперативной памятью по сравнению с Radeon Xpress 1150.
Переходим к гораздо более интересным тестам — игровым, которые, чтобы не засорять диаграммы одинаковыми результатами, покажем только для случая использования интегрированной графики.
DOOM 3 создает весьма серьезную нагрузку даже при минимальном разрешении, которое трудно назвать «играбельным» даже для лидера — GeForce 6150.
Зато в FarCry поиграть можно вполне, причем с любой из рассматриваемых версий интегрированной графики, обращает на себя внимание различие в производительности в режимах с высоким и минимальным качеством графики для NVIDIA-чипсетов.
Здесь наблюдаем некую промежуточную картину между двумя предыдущими, не нарушающей общей расстановки. Отсюда — общий вывод: значительное, вплоть до двукратного, превосходство чипсетов GeForce перед Radeon Xpress 1150 на низком разрешении и выкрученных на минимум графических настройках (что, вообще, задает в современных играх весьма неприглядную графику) сходит на нет и обращается в минус при тестировании на среднем и высоком разрешениях, особенно в случае сравнения с GeForce 6100. Отставание GeForce 6100 в паре с южным мостом nForce 410 от одноименного одночипового решения (nForce 405), которое можно отметить на всех трех диаграммах, не обязательно означает, что в этой разнице повинны именно чипсеты. Тестирование MSI K9NGM, представляющей «старый» чипсет GeForce 6100 в настоящем обзоре, продемонстрировало ее незначительное отставание от модели Foxconn на аналогичном чисете (к сожалению, на момент проведения «чипсетных» тестов она была недоступна), в то время как ECS GeForce 6100SM-M является единственной, доступной на сегодня, платой на GeForce 6100 + nForce 405. И поскольку отклонения не слишком велики, логично предположить, что в среднем платы на обеих версиях, исходя из игровой производительности, равнозначны, а для выбора «самой быстрой» следует обратиться к тестам самих плат (реальная частота графического ядра, судя по тестам, отличается у плат от разных производителей).
С практической точки зрения, чипсеты NVIDIA выглядят привлекательнее для активных сетевых игр, когда снижение разрешения и настроек ради получения максимальной скорости отклика, является естественным шагом, тогда как ATI обеспечит лучшую поддержку для «спокойных» игр — стратегий, квестов и т.п. А поскольку на сегодня Radeon Xpress 1150 позиционируется даже ниже чем GeForce 6100 (платы на его основе стоят дешевле), можно отметить, что в нынешних условиях все рассматриваемые чипсеты находятся на своем месте и явных аутсайдеров нет.
Разобравшись с играми, переходим к еще менее изученному аспекту функционирования интегрированной графики — поддержке декодирования сжатого видео в форматах MPEG2 и WMV. Поддержка воспроизведения «простого» MPEG2 появилась уже очень давно, а современные чипсеты должны работать и с HD-разновидностью. Но это — в теории, на практике, пожалуй, первым вопросом, особенно, после ознакомления с результатами тестирования дискретных видеокарт (причем старших моделей), будет такой, — «а хватит ли интегрированной графике мощности, и будет ли она сколько-нибудь серьезным подспорьем для современных центральных процессоров?» Интутитивный ответ — «хуже не будет», даже незначительная помощь со стороны чипсета позволит разгрузить процессор для других задач. Но давайте не торопиться с выводами. Для оценки процессорного времени, выделенного на процесс декодирования, в течении прогона видеоролика, использовалась стандартная информация из «Диспетчера задач Windows» — меню «Вид» — «Выбрать столбцы» — «Время ЦП». Определить среднюю загрузку процессора в традиционных процентах (а именно она приведена на диаграммах), зная длительность прогона каждого ролика, очень легко.
Очевидно, что поток MPEG2 (около 0,7 Мбайт/c в данном случае) не представляет сложности для декодирования, даже если им целиком займется процессор, а уж при поддержке чипсета — подавно, и результаты декодера CyberLink наглядно это иллюстрируют (тут надо отметить, что все современные декодеры используют функции аппаратного ускорения, а не только «фирменные» от NVIDIA и ATI). Но что мы наблюдаем в случае с фирменным декодером от NVIDIA? Пусть около 10% загрузки не есть критическая величина и на производительности в фоновых задачах скажется незначительно, но здесь мы рассматриваем самый «легкий» формат сжатия, и что же мы увидим в более сложных случаях? Рационального объяснения нет, даже если предположить, что декодер от NVIDIA больше полагается на функции чипсета (а тот в виду своей маломощности с задачей не справляется), то почему максимальная нагрузка на процессор обнаружилась в случае с самым мощным чипсетом (GeForce 6150)? Поскольку реальная разница в последнем случае не велика, предположим, влияние фоновых процессов и погрешности измерения (чем, конечно же, нельзя объяснить отставание от декодера CyberLink). К сожалению, NVIDIA PureVideo продолжит нас удивлять и дальше, и у автора за время подготовки статьи на него вырос огромный зуб, поскольку пришлось по нескольку раз перетестировать с разными платами, дистрибутивами Windows и софта, драйверами и версиями самого декодера, дабы убедиться, что способ получения результатов достоверный, а дело — в самом декодере.
Что называется — «приехали», поток данных увеличился до 2,4 Мбайт/с, и если Cyberlink с честью разделался с ним, то собственный декодер от NVIDIA, вероятно, занимался еще какими-то внутренними расчетами (рабочая гипотеза — вычислял значение числа «пи»), обратите внимание, что в одном случае загрузка процессора превысила 50%, а это означает, что не будь наш процессор двухъядерным, его ресурсов в данной ситуации просто бы не хватило (что и подтверждают тесты с нарочно взятым младшим Sempron). Чипсет GeForce 6150, наконец, обнаружил зримое преимущество перед GeForce 6100, а лидером теста (разумеется, при использовании декодера CyberLink) оказался Radeon Xpress 1150. Результаты кажутся еще более неожиданными, если учесть, что при сравнении дискретных видеокарт расстановка получилась едва ли не с точностью до наоборот. Чтобы несколько сгладить категоричный вывод (но полностью продиктованный результатом теста!), отметим, что, вполне возможно, декодер от NVIDIA использует более тщательный и ресурсоемкий постпроцессинг и, при условии достаточного количества ресурсов в своем распоряжении, обеспечивает более четкое изображение. Но, во-первых, визуально разница в качестве изображения никак не обнаруживается (анализ с лупой в руках, хорош, когда по остальным признакам решения примерно равнозначны, здесь же имеем совершенно неадекватную разницу в части ресурсоемкости), во-вторых, даже если предположить, что процессорные ресурсы действительно целиком используются для повышения качества изображения, NVIDIA просто обязана быть в курсе возможностей собственных аппаратных решений и, видимо, разрешить декодеру масштабировать нагрузку в зависимости от конфигурации компьютера.
Декодирование Windows Media Video (с помощью встроенного в Windows Media Player декодера WMV9) обошлось без сенсаций. Рассматриваемые чипсеты назвать равноценными, поскольку отклонения в пределах 3—5% в данном случае вписываются в погрешность измерения. Резюмируя тесты видеодекодирования, можно отметить, что декодер Cyberlink дает более стабильный результат (скажем определеннее — приобретение собственного декодера от NVIDIA для системной платы с интегрированной графикой не имеет смысла, что наглядно демонстрируют тесты), преимущество GeForce 6150 перед GeForce 6100, действительно, наблюдается, но лишь в единственном тесте. Очень интересно и неожиданное лидирование Radeon Xpress 1150, который, пожалуй, можно отметить, как предпочтительный выбор с точки зрения способностей к декодированию видео.
Выводы
Интегрированные графические решения, по определению, являются более консервативными, нежели дискретные, и если на момент выпуска уровень видеоядра достаточно высок, могут успешно существовать на рынке несколько лет. Впрочем, для чипсета важной является также поддержка актуального набора периферийных интерфейсов. По обоим критериям семейство чипсетов NVIDIA GeForce 6100/6150 можно назвать исключительно удачным, а с выходом одночиповых версий, ничего не мешает его расширению на сегмент самых дешевых плат, где требования к оснащенности и производительности минимальны и традиционно сильны позиции чипсетов VIA. Впрочем, как продемонстрировало тестирование, и Radeon Xpress 1150, чья «карьера» под другим именем началась еще на год раньше, не выглядит однозначно более слабым, и выступил, пожалуй, даже лучше, чем мы предполагали. Очевидно, в сочетании с современным южным мостом (SB600), младший и единственный на сегодня интегрированный чипсет от AMD (ATI) представляет сильную конкуренцию GeForce 6100. Наконец, вывод навеянный результатами тестов видеодекодирования — исследование явно не закончено и напрашивается продолжение с расширенным количеством декодеров и видеороликов в разных форматах, которое, скорее всего, последует с выходом чипсета AMD 690 и появлением плат на его основе в нашей лаборатории.