Помнится, на нашем сайте была опубликована одна статья, связанная с чипсетом NVIDIA, где речь заходила о суевериях и предрассудках, но надо сказать, с появлением пошедшего в народ nForce2 число этих самых суеверий и слухов вокруг продукции NVIDIA возросло так, что стало заметно, кажется, уже всем. Мы решили посвятить маленькое практическое исследование исключительно просвещению масс, и сразу предупреждаем, что ничего действительно нового внимательные читатели здесь не найдут. Более того, статья написана намеренно простым языком и ужасно сложные термины вроде «банк памяти» в ней не используются пожалуйста, будьте снисходительны: это, можно сказать, объяснение для начинающих.
Простые истины чипсета nForce2
Первый, самый забавный вопрос, которой чересчур часто задается в форумах и письмах в редакцию: будут ли работать видеокарты ATI (имеется в виду на чипах ATI) на чипсете NVIDIA? Пожалуй, больший интерес мог бы вызвать только вопрос о работоспособности процессоров Intel на чипсетах AMD (или наоборот) к чипсетам VIA как-то все попривыкли уже, и сомневаются в них разве что самые упертые и глухие. Комментировать на полном серьезе тут нечего, просто констатируем: видеокарты линеек ATI без каких-либо проблем работают в материнских платах на чипсетах NVIDIA, а видеокарты линеек NVIDIA аналогично успешно функционируют в системных платах на чипсетах ATI (правда, скорость тут ну, это уже совсем другая, гораздо более грустная история ).
Дальше пошли вопросы интереснее, связанные как раз с двухканальным контроллером nForce/2. Итак, внимание: для двухканального режима используются самые обычные модули памяти, причем объем памяти в этом режиме равен суммарному объему установленных модулей, а не его половине (и это справедливо для всех без исключения двухканальных чипсетов). Вроде бы очевидно, но спрашивают, факт.
Теперь копнем чуть глубже: что же именно нужно для организации двухканальности на nForce/2? Потребуется как минимум 2 модуля памяти, причем один из них обязательно должен быть установлен в выделенный своим расположением на материнской плате разъем. (Как правило, он называется DIMM0, в противовес DIMM1/2, или же DIMM1, при наличии также DIMM2/3.) Неверная установка приведет к невозможности задействовать второй контроллер памяти. Модули не обязательно должны быть полностью идентичны (и уж тем более не требуется совпадения их производителей), а вот скоростные характеристики желательно иметь одинаковыми, так как иначе в двухканальном режиме скорость будет выставлена по наиболее медленному (например, DDR266 при одном модуле DDR266 и одном DDR400). Также можно использовать три модуля, но тут следует иметь в виду, что двухканальный доступ может быть обеспечен только для объема, равного удвоенному размеру первого модуля (того, что установлен в разъем с минимальным номером) в случае, конечно, если размер первого не превосходит суммы размеров второго и третьего. Очевидно, таким образом, что наиболее оптимальны следующие два случая: одинаковые по размеру модули памяти, установленные в первый и второй разъемы, или же три модуля, причем объем первого равен сумме объемов второго и третьего.
Ну а теперь самое интересное. Очень часто (в том числе, и в наших статьях) вы можете видеть/слышать рядом два выражения: «двухканальный nForce2» и «самый быстрый среди чипсетов под Socket A nForce2». По отдельности они абсолютно корректны, но отсюда совсем не следует взаимно-однозначного соответствия между «двухканальным» и «самым быстрым». В самом деле, как хорошо известно, системная шина EV6, используемая для Socket A, имеет ограниченную пропускную способность в 2100 МБ/с при частоте 133 МГц и 2700 МБ/с при частоте 166 МГц. Это означает, что сколь бы быстро ни отрабатывал(и) контроллер(ы) памяти, до процессора данные дойдут не быстрее, чем позволяет шина, а потому именно процессору не требуется память быстрее DDR266 в первом случае и DDR333 во втором. Разумеется, цифры приведены для одноканального режима доступа так нужен ли тут вообще двухканальный, с его нереально большой пропускной способностью?
Рассуждая теоретически, можно предположить две ситуации, когда он нужен: при преобладании доступа к памяти по случайному алгоритму (двухканальность позволяет уменьшить задержку доступа по следующему случайному адресу, но в жизни такая ситуация почти не встречается) и при наличии иных, кроме процессора, устройств, читающих из памяти или пишущих в нее. Собственно, таковых можно припомнить два наиболее важных типа: видеокарты и IDE-устройства с DMA (а также устройства для шины CSA в чипсетах Intel 875P/865x).
Однако «чистый» вывод о том, насколько ускоряет систему двухканальный контроллер памяти, мы сделать не можем, потому что NVIDIA в своих чипсетах применяет еще одно оригинальное техническое решение DASP. Этот, являющийся, по сути, буфером при контроллере памяти, модуль обладает продвинутыми возможностями по предсказанию и предвыборке данных, так что он и сам по себе может обеспечивать некоторое превосходство в скорости над конкурентами nForce и особенно nForce2, в котором применяется его переработанная и улучшенная версия.
Именно исследованию того, насколько отличаются друг от друга одноканальный и двухканальный режимы nForce2 (а значит, какая часть его превосходства в скорости обусловлена этим фактором, а какая другими, включая, конечно, и DASP) и посвящено тестирование, результаты которого перед вами.
Croteam/GodGames Serious Sam: The Second Encounter v1.07
Мы использовали процессор со 166-мегагерцовой шиной, и память на обоих протестированных чипсетах работала на той же частоте при минимальных таймингах (напомним, что применение DDR400 c CL 2,5 на KT400 лишь тормозит этот чипсет). Также, вспоминая о том, что изначально двухканальный режим контроллера памяти задумывался NVIDIA для ускорения работы варианта чипсета с интегрированной графикой, мы проверили и этот режим. Ну и заодно сравнили в игровых приложениях интегрированную графику nForce2-G (обозначена на диаграммах как IGP) c теоретически соответствующей ей внешней видеокартой на чипе GeForce4 MX 440. Прямой задачи сравнить в очередной раз nForce2 c KT400 у нас не было, так что цифры чипсета VIA приведены, скорее, для наглядности.
Результаты тестов
При чтении и записи по «прямолинейному» алгоритму Cachemem результаты nForce2 почти совпадают во всех режимах, за исключением одноканального при использовании интегрированной графики, а вот при потоковом копировании Wstream двухканальный режим обеспечивает вполне приличный выигрыш в 20%. Такое преимущество достигается как раз за счет большей скорости работы памяти при двухканальности, но вот увидим ли мы подобное в реальных приложениях? Также хорошо видно, что KT400 заведомо медленнее одноканального nForce2 во всех тестах, кроме скорости копирования, где они равны.
Кодирование видеопотока в MPEG4 и архивирование с 4-мегабайтным словарем это, пожалуй, наилучшие тесты связки «памятьпроцессор». Они дают очень похожие по характеру результаты, причем вновь заметно отстает лишь одноканальный режим с интегрированным видео, а вот двухканальность обеспечивает системе незначительный прирост скорости в 23%, и оставшегося «запаса» пропускной способности с лихвой хватает на компенсацию работы со встроенным видеоядром.
Таким образом, мы видим, что двухканальность в реальной жизни практически не ускоряет процессорные задачи, и превосходство nForce2 над KT400 в этих тестах обусловлено иными преимуществами архитектуры чипсета NVIDIA. А вот для работы с интегрированной графикой nForce2-G двухканальный режим подходит как нельзя лучше, обеспечивая нулевое падение производительности в сравнении с дискретной версией чипсета (или работой с внешней видеокартой).
Использование профессионального пакета тестов для ускорителей трехмерной графики позволит нам проверить еще один тип взаимодействия компонентов платформы. Разумеется, здесь уже у nForce2 IGP нет никаких шансов догнать GeForce4 Ti 4600, так как производительность «убивается» его возможностями в ускорении 3D, поэтому эффект от задействования двухканальности для него сродни синтетическим тестам памяти так же неприменим к реальной жизни.
А вот теперь самое интересное. Для понимания полученных результатов давайте взглянем на суть тестов SPECviewperf. Все они предполагают интенсивное задействование 3D-функций видеокарт, а от процессора требуется в основном быстро рассчитывать базовые параметры и координаты сцены и быстро же пересылать полученные огромные массивы данных по AGP видеоускорителю. От положения дел с играми ситуация отличается очень сильно, так как там на процессоре дополнительно «висит» большое количество задач, и не удается так точно сопоставить загрузку процессора и видеокарты. Например, в низких разрешениях при низком качестве графики фактически игру тормозит процессор, а видеокарта быстро отрисовывает очередной кадр, а вот в высоких разрешениях при повышенном качестве графики уже видеоускоритель занят «украшательствами» картинки, в то время как процессор свою часть задачи выполняет гораздо быстрее. Очевидно, что «где-то посередине» мы можем встретить ситуацию, аналогичную положению дел в SPECviewperf, к анализу которого мы сейчас и переходим.
Итак, в первую очередь бросается в глаза долгожданный отрыв двухканального режима nForce2 от одноканального. Причем это явно не случайный результат: он наблюдается в трех тестах пакета (из шести). В остальных тестах все участники, использующие GeForce4 Ti 4600, идут более или менее вровень, и отрыв двухканального nForce2 невелик, но 16, 19 и 25% (в dx-07, proe-01 и drv-08 соответственно) это, безусловно, очень значимо, и даже больше, чем удалось «выжать» в синтетическом тесте Wstream. Скорее всего, здесь как раз налицо ситуация идеального баланса между процессором и видеоускорителем, когда они выполняют свою часть работы с примерно одинаковой скоростью, а потому расширение пропускной способности памяти позволяет контроллеру памяти полностью утилизировать процессорную шину и одновременно выдавать данные по AGP видеокарте. Кстати, любопытно, что в тесте с максимальной разницей (drv-08) KT400 впервые обгоняет nForce2 (одноканальный), и если там сравнивать двухканальный nForce2 c KT400, то получим как раз примерно те же 1519%, что и в двух остальных тестах. Так что, возможно, мы наблюдаем некий артефакт производительности у чипсета NVIDIA.
В играх, увы, ничего интересного и неожиданного. В любых сочетаниях разрешений и настроек графики при использовании внешней видеокарты преимущество от двухканальности не достигает и 4%, причем максимально оно в «слабых» условиях, то есть когда ускорять получается уже рассмотренную нами связку «процессорпамять», и получается это с тем же успехом. Из остального можно отметить прекрасный эффект от задействования двух каналов при интегрированной графике, что, впрочем, никак не позволяет IGP выглядеть достойно в сравнении с внешним GeForce4 MX 440.
Для наглядности сведем данные по основной линии сегодняшнего сравнения в таблицу (пишите нам, что вы думаете о таком способе представления информации):
Двухканальный режим против одноканального, разница в процентах
При использовании внешней видеокарты (GF4Ti4600)
При использовании интегрированного графического ядра (IGP)
чтение из памяти
+0,4
+4,4
запись в память
+2,3
+15,5
копирование памяти
+20,9
+31,5
MPEG4
+2,2
+6,7
WinAce
+2,9
+8,4
drv-08
+24,7
+55,0
dx-07
+15,9
+65,8
3dsmax-01
+1,8
+13,5
light-05
+4,6
+45,0
proe-01
+19,0
+24,6
3DMark2001
+1,7
+65,0
RtCW(Fast)
+3,5
+42,4
RtCW(High)
+1,1
+76,1
SS2(Speed)
+2,8
+40,6
SS2(Normal)
+1,8
+67,1
Выводы
На основании приведенных данных можно сделать два уверенных вывода. Во-первых, двухканальность для nForce2 всегда дает положительный эффект, и поскольку достигается эта двухканальность фактически бесплатно (требуется два модуля памяти меньшего размера вместо одного большого), то вполне имеет смысл получить эти 24% прироста производительности.
Во-вторых, однако, важно отметить, что двухканальность не то оружие, с помощью которого NVIDIA добилась победы на чипсетном фронте. Прекрасный чипсет VIA KT400 капитулирует перед одноканальным nForce2 в тех же условиях, что и перед двухканальным (за исключением одного-единственного случая), так что причину успеха следует искать в других компонентах системной логики калифорнийской фирмы, в том числе, вполне вероятно, в удачном применении действительно уникального блока DASP.
Ну и в заключение отметим, что если вы собираетесь использовать интегрированную графику чипсета nForce2-G/T, то обеспечение двухканального режима работы для вас обязательная задача: от 10 до 70% потери в скорости вы наверняка сможете заметить визуально, безо всяких тестов. И имейте в виду, что указанное в спецификации чипсета nForce2-G соответствие использованного там графического ядра чипу GF4 MX440-8x к реальной жизни имеет отдаленное отношение: меньшие частоты работы самого чипа в IGP и системной памяти приводят к значительно худшим показателям в тестах трехмерной графики, так что не окажитесь разочарованными после покупки.
Системная плата MSI K7N2G-LISR предоставлена компанией «Neo Group»