Двухканальная DDR2-800/1066 на платформах Intel Core 2 Extreme QX9770 / Intel X48 и AMD Phenom X4 — первые результаты тестов в RightMark Memory Analyzer


Раскрытию скоростного потенциала двухканальной памяти типа DDR2-800 (и более высокоскоростных категорий) мы посвятили уже немало исследований. Интерес к этим исследованиям вызван скоростным потенциалом двухканальной памяти DDR2 как таковой, который по-прежнему остается нераскрытым ввиду наличия «узких мест» системы, представленных другими компонентами подсистемы памяти.

В случае платформ Intel основным препятствием к раскрытию скоростного потенциала памяти выступает системная шина (FSB), общая для всех процессорных ядер (и системных процессоров вообще, если рассматривать многопроцессорные системы) и всегда обладающая меньшей пропускной способностью (ПС) по сравнению с пропускной способностью двухканальной DDR2. В нашем предыдущем исследовании на эту тему участвовали чипсеты Intel 975X и 965G с частотой системной шины 266 МГц, обеспечивающей ПС порядка 8.53 ГБ/с. Надо сказать, в этом исследовании мы уже почти достигли реальные величины пропускной способности памяти (ПСП), приближающиеся к этой отметке. Однако сама по себе эта отметка весьма далека от теоретической ПС DDR2-800 (12.8 ГБ/с), что не позволяло нам говорить о раскрытии скоростного потенциала памяти.

Особый интерес представляют исследования многоядерных платформ AMD с интегрированным контроллером памяти DDR2 (начиная с платформы «AM2»). На этих платформах в принципе возможно полное раскрытие потенциала ПС подсистемы памяти вследствие отсутствия «узкого места» в виде системной шины, общей для всех ядер процессора, теоретическая ПС которой оказывается заведомо ниже теоретической ПС двухканальной DDR2. Тем не менее, наши первые исследования представителей платформы AMD «AM2» — процессоров Athlon 64 X2 и Athlon 64 FX с частотой ядра от 2.0 до 2.8 ГГц показали, что достижимые на практике величины ПСП на этой платформе оказываются значительно ниже своего теоретического предела и напрямую зависят от частоты процессорного ядра и контроллера памяти. Как выяснилось, причиной этого является сравнительно узкая (64-битная двунаправленная) шина L1-L2 кэша ядра процессора, эффективная ПС которой оказывается ниже, чем теоретическая ПСП двухканальной DDR2-800. В связи с этим, далее мы впервые предприняли попытку исследовать «многоядерный» доступ к памяти, в данном случае — со стороны двух потоков, одновременно исполняемых на обоих ядрах процессора. Применение такого варианта доступа в память должно было снять ограничение, связанное с узостью шины L1-L2 кэша ядра процессора, поскольку каждое ядро процессоров Athlon 64 X2 имеет собственные L1- и L2-кэши. Однако наблюдаемое нами увеличение ПСП при переходе от «одноядерного» доступа в память к «двухъядерному» нельзя было назвать значительным — так, в тестах чтения данных с программной предвыборкой прирост составил не более 15%, а абсолютный показатель ПСП не превысил 70% от теоретического значения. Очевидно, на этот раз «узким местом» системы выступил уже сам интегрированный контроллер памяти.

Таким образом, в наших предыдущих исследованиях мы показали, что раскрытию высокого скоростного потенциала двухканальной DDR2-800 (и, в особенности, ее более высокоскоростных вариантов) на платформах Intel препятствует сравнительно «узкая» системная шина, общая для всех ядер процессора, а на платформах AMD «AM2» — несколько устаревшая архитектура ядра процессоров AMD Athlon 64 X2 (не претерпевшая существенных изменений с выхода первых моделей Athlon 64), а также предел эффективности интегрированного контроллера памяти DDR2. В этом отношении, большие надежды можно возлагать на новое поколение платформ Intel и AMD. Первая из них представлена четырехъядерным процессором Intel Core 2 Extreme QX9770 с тактовой частотой 3.2 ГГц, основанном на новом 45-нм ядре Yorkfield и чипсетом Intel X48. Частота системной шины этого процессора и чипсета составляет 400 МГц, и ее ПС в точности соответствует ПСП двухканальной DDR2-800. Вторая из платформ основана на инженерном образце 2.4-ГГц процессора недавно анонсированной линейки четырехъядерных процессоров AMD Phenom X4. В этих процессорах изменения коснулись как архитектуры ядра (в частности и в особенности, его «узкого места» — шины L1-L2 кэша данных), так и интегрированного контроллера памяти.

Конфигурация тестовых стендов

Стенд №1

  • Процессор: Intel Core2 Extreme QX9770 (инженерный образец), 3.2 ГГц (400 МГц x8)
  • Чипсет: Intel X48
  • Материнская плата: Gigabyte X48-DQ6 (инженерный образец), BIOS версии E4 от 30.10.2007
  • Память: 2x1 ГБ Corsair XMS2-6400, DDR2-800, тайминги 5-5-5-15

Стенд №2

  • Процессор: AMD Phenom X4 9700 (инженерный образец), 2.4 ГГц (200 МГц x12)
  • Чипсет: AMD 790FX
  • Материнская плата: MSI K9A2 Platinum, BIOS версии V1.1B3 от 16.11.2007
  • Память: 2x1 ГБ Corsair XMS2-6400, DDR2-800, тайминги 5-5-5-15-2T
  • Память: 2x1 ГБ Corsair DOMINATOR XMS2-9136C5D в режиме DDR2-1066, тайминги 5-5-5-15-2T

Intel Core 2 Extreme QX9770 / Intel X48

На этой платформе мы использовали двухканальную память типа DDR2-800, поскольку, как было отмечено выше, теоретическая ПС этого типа памяти идентична теоретической ПС 400-МГц системной шины. Вследствие этого достигается синхронный режим ее работы (соотношение частот FSB:DRAM = 1:1), оптимальный с точки зрения производительности подсистемы памяти.

Измерения проводились с помощью вспомогательного инструмента RightMark Multi-Threaded Memory Test в нескольких режимах доступа к памяти: однопоточном, двухпоточном со стороны двух ядер общего физического ядра и двух ядер разных физических ядер процессора (напомним, что четырехъядерные процессоры Intel Core 2 представляют собой как бы два двухъядерных процессора, «прикрепленных» к общей системной шине), а также в четырехпоточном со стороны всех четырех ядер процессора. Во всех случаях, размер тестируемого блока памяти составлял 64 МБ (поделенных поровну на количество потоков, например, 32+32 МБ при двухпоточном доступе) и измерялись следующие показатели: пропускная способность памяти на «обычное» чтение данных (Read) и чтение с программной предвыборкой (Read PF), на «обычную» запись данных (Write) и запись в режиме прямого сохранения, минуя все уровни кэш-памяти процессора (Write NT).

Объединенный результат тестирования представлен на диаграмме. В условиях однопоточного доступа реальная ПСП достигает величин порядка 6.7 ГБ/с (обычное чтение) — 7.3 ГБ/с (чтение с программной предвыборкой). Нельзя сказать, что они сильно отличаются от значений, типичных для предыдущих поколений платформ Intel Core 2 (в нашем прошлом исследовании они составляли 6.0 — 6.8 ГБ/с). ПСП при обычной записи данных достигает уровня 2.8 ГБ/с, типичного для платформ Intel, однако наиболее интересный результат показывает измерение ПСП при записи данных методом прямого сохранения, в котором достигается величина порядка 8.3 ГБ/с (65% от теоретической ПСП). Если вспомнить, что величина ПСП при записи данных методом прямого сохранения данных на платформах Intel (начиная с процессоров семейства Pentium 4 и включая процессоры семейства Core 2) ограничена 2/3 теоретической ПС системной шины, данный результат можно считать прямым подтверждением высокой эффективности новой 400-МГц системной шины платформы Intel Core 2 Extreme QX9770 / Intel X48.

Рассмотрим результаты тестов двухпоточного обращения к памяти, представленные двумя вариантами — доступом со стороны двух ядер одного физического ядра («2 потока, общее ядро») и двух ядер разных физических ядер процессора («2 потока, разные ядра»). Легко заметить, что чтение данных двумя ядрами одного и того же физического ядра процессора приводит к достижению меньших величин ПСП на чтение по сравнению с чтением данных двумя ядрами разных физических ядер процессора. Причина этого явления достаточно очевидна: в первом случае два потока теста в равной степени разделяют между собой общий 6-МБ L2-кэш одного из физических ядер процессора, во втором случае каждому из потоков становится доступно по 6 МБ L2-кэша соответствующего физического ядра (т.е. в сумме двум потокам теста оказываются доступны все 12 МБ L2-кэша процессора). Большая кэшируемость данных приводит к большим величинам ПСП, хотя и не связанных напрямую с характеристиками самой подсистемы памяти. Что интересно, обратный эффект наблюдается при записи данных — двухпоточный доступ со стороны разных физических ядер процессора приводит к величине ПСП (2.62 ГБ/с), даже меньшей по сравнению с ПСП на «однопоточную» запись данных (2.78 ГБ/с), и значительно меньшей по сравнению с ПСП, достигаемой при «двухпоточной» записи данных со стороны двух ядер одного и того же физического ядра процессора (3.46 ГБ/с). Возможно, это связано с синхронизацией содержимого L2-кэшей процессора, которая осуществляется с заметно большей эффективностью при утилизации лишь одного обобщенного L2-кэша одного из физических ядер процессора.

Что касается результатов четырехпоточных тестов при одновременном доступе к памяти со стороны всех четырех ядер, разумно ожидать, что соответствующие величины ПСП окажутся «где-то посередине» между величинами ПСП двухпоточного доступа со стороны двух ядер общего физического ядра и разных физических ядер процессора. Как показывают результаты наших тестов, на практике примерно так оно и оказывается. Немного настораживают, однако, максимально достижимые реальные значения ПСП, которые при двух- и четырехпоточном доступе, во-первых, не сильно выигрывают по сравнению с ПСП при однопоточном доступе (максимальный прирост составляет не более 25%), а во-вторых, оказываются по-прежнему далеки от теоретической ПС системной шины и памяти. Лучший результат реальной ПСП, показанный при двухпоточном чтении данных с программной предвыборкой разными физическими ядрами (9.14 ГБ/с) составляет лишь 71% от теоретического значения. Конечно, этот результат превысил рекорд, ранее достигнутый на платформах Intel Core 2 с 266-МГц системной шиной (8.33 ГБ/с), однако он не достигает даже теоретической ПС, присущей 333-МГц системной шине и/или двухканальной памяти типа DDR2-667 (10.67 ГБ/с). Получается, что подсистема памяти платформы Intel Core 2 все же несколько выигрывает от использования «широкой» 400-МГц системной шины, но в весьма незначительной степени.

AMD Phenom X4 2.4 ГГц

Напомним, что в новых процессорах AMD претерпели изменения как архитектура ядра (прежде всего, нас сейчас интересует его «узкое место» — шина L1-L2 кэша данных), так и интегрированный контроллер памяти. Начнем с краткого рассмотрения шины L1-L2 кэша данных ядра процессора (ее более полное изучение мы проведем при более детальном знакомстве с архитектурой ядра Phenom). Результат измерения ПС этой шины приведен ниже.

Легко убедиться, что эффективность этой шины значительно возросла — ее ПС достигает почти предельного значения (для 128-разрядной шины) 7.99 байт/такт (15.98 байт/такт с учетом эксклюзивной организации кэша данных, при которой пересылка каждой строки кэша из L2 в L1 сопровождается вытеснением наименее нужной строки кэша из L1 и L2) при считывании данных, и примерно 4.7 (9.4) байт/такт при записи данных. Соответствующие показатели процессоров Athlon 64 X2 оказываются заметно ниже и составляют примерно 4.75 (9.5) байт/такт при операциях чтения и 4.55 (9.1) байт/такт при операциях записи.

В рамках настоящего исследования еще более примечательным оказывается показатель ПС шины L1-L2 кэша данных процессоров Phenom, выраженный в ГБ/с (т.е. с привязкой к частоте ядра процессора). В нашем случае (частота ядра 2.4 ГГц) он составляет весьма внушительную величину порядка 19.25 ГБ/с, что заметно выше даже по сравнению с теоретической ПС двухканальной памяти DDR2-1066 (примерно 17.6 ГБ/с). Таким образом, мы можем сказать, что шина L1-L2 кэша данных в процессорах AMD Phenom уже перестает быть «узким местом» системы, предоставляя достаточный запас по скорости передачи данных.

Разумно предположить, что увеличение эффективности шины кэша данных процессора AMD Phenom (по сравнению с шиной кэша данных процессоров семейства Athlon 64) связано с изменением типа ее организации при сохранении ее очевидной 128-битной разрядности. Для проверки этого предположения мы воспользовались тестом прибытия данных по шине L1-L2, результат которого представлен на рисунке.

Полная количественная интерпретация этого результата потребует более детального знакомства с архитектурой ядра Phenom (изучению которой будет посвящена отдельная статья), здесь же отметим, что довольно низкие значения «суммарной латентности» двух обращений к элементам данных строки L2-кэша при прямом и обратном обходе и их практически полная нечувствительность к расстоянию между элементами данных (ось абсцисс на графике) указывает на реализацию аппаратной предвыборки данных на уровне L2-кэша ядра процессора — впервые для процессоров AMD. Более правдоподобные значения латентности двух обращений и большую чувствительность к изменению расстояния между элементами данных показывают кривые псевдослучайного и случайного доступа, на которых заметно 1-тактное увеличение латентности при смещении 2-го элемента относительно 1-го на 48 байт и более. А это означает, что шина L1-L2 кэша данных ядра процессора Phenom способна переслать до 48 байт данных за 3 такта доступа в L1-кэш (латентность которого по-прежнему составляет 3 такта), т.е. ее эффективная ПС «в одну сторону» составляет 48/3 = 16 байт/такт (эффективная разрядность — 128 бит). Напомним, что эффективная ПС шины L1-L2 кэша данных процессоров семейства Athlon 64 «в одну сторону» составляет всего 8 байт/такт (эффективная разрядность — 64 бита). Отсюда мы можем заключить, что в новых процессорах AMD Phenom организация шины L1-L2 кэша данных действительно претерпела изменения — она превратилась из 64-битной двунаправленной шины (привычной для процессоров семейства Athlon 64) в 128-битную однонаправленную.

Рассмотрим теперь интегрированный контроллер памяти новых процессоров AMD Phenom X4. Согласно документации, он может функционировать с памятью типа DDR2 (включая память неофициального стандарта DDR2-1066), а также DDR3, однако доступные в настоящее время модели процессоров AMD Phenom X4 поддерживают только DDR2. Интегрированный контроллер памяти состоит из двух отдельных 64-битных контроллеров DDR2, в связи с чем можно представить три варианта его функционирования:

  • Одноканальный режим, когда активным («заселенным» модулями памяти) оказывается лишь один из 64-битных контроллеров;
  • Двухканальный спаренный режим (ganged mode), интегрированный контроллер памяти «виден» процессору как единый 128-битный контроллер;
  • Двухканальный распаренный режим (unganged mode), интегрированный контроллер памяти представлен процессору как два независимых 64-битных контроллера.

Одноканальный режим на сегодняшний день не представляет большого практического интереса, как и одноканальный режим функционирования памяти DDR2 вообще. Так называемый спаренный (ganged) режим представляет собой привычный двухканальный режим функционирования памяти — при этом оба 64-битных контроллера «заселены» одинаковыми модулями памяти (по своему типу, скоростным характеристикам, объему и физической организации), а эффективная ширина шины памяти составляет 128 бит (по 64 бит на каждый контроллер). Более интересным является новый, распаренный режим функционирования интегрированного контроллера памяти, занимающий промежуточное положение между истинно двухканальным (спаренным) и одноканальным режимами. При этом каждый из 64-битных контроллеров могут быть «заселены» памятью одного типа (DDR2 либо DDR3 для будущих моделей процессоров, но не DDR2 и DDR3 одновременно) и скоростной категории (например, DDR2-800), но разного объема и/или физической организации, и функционируют независимо. Разрядность шины памяти при этом составляет 64 бита — на первый взгляд, это мало чем отличается от одноканального режима работы. Это действительно так при обращении одного ядра процессора к одному участку данных в памяти, однако при снятии этих ограничений (т.е. при осуществлении одноядерного либо многоядерного доступа к данным, расположенным в различных областях памяти) возможно одновременное обращение к обоим 64-битным контроллерам памяти, что мы увидим ниже при рассмотрении результатов многопоточных тестов.

Еще одним важным новшеством интегрированного контроллера памяти процессоров семейства AMD Phenom X4 является наличие L3-кэша данных, который относится именно к интегрированному контроллеру памяти и посему является общим для всех четырех независимых ядер процессора, обладающих собственными L1- и L2-кэшами (в нашем случае — объемом 64 и 512 КБ, соответственно).

Перейдем к результатам тестов подсистемы памяти. Поскольку интегрированный контроллер памяти AMD Phenom X4 поддерживает как DDR2-800, так и DDR2-1066, мы провели тесты с участием обоих типов памяти (DDR2-800 и DDR2-1066). Тесты проводились как в спаренном (ganged), так и в распаренном (unganged) режимах работы контроллера, при доступе в память одного ядра процессора (однопоточный тест) и всех четырех ядер (многопоточный тест). Как и в проводимых ранее тестах, размер тестируемого блока памяти составлял 64 МБ (16+16+16+16 МБ при четырехпоточном доступе) и измерялись показатели пропускной способности памяти при «обычном» чтении данных (Read) и чтении с программной предвыборкой (Read PF), а также при «обычной» записи данных (Write) и записи методом прямого сохранения (Write NT).

При однопоточном доступе к памяти типа DDR2-800 новый Phenom X4 в «спаренном» режиме работы контроллера показывает заметно лучший результат при «обычном» чтении данных по сравнению с равночастотным Athlon 64 X2 4800+, участвующем в нашем прошлом исследовании — 6.3 ГБ/с против 3.9 ГБ/с. Наиболее вероятно, так сказывается влияние новой, заметно более эффективной шины памяти L1-L2 кэша ядра процессора. Однако то же самое нельзя сказать о ПСП на чтение данных с программной предвыборкой — она оказывается весьма небольшой сама по себе (демонстрирует небольшой прирост по сравнению с ПСП на «обычное» чтение данных — 7.4 против 6.3 ГБ/с), и даже меньшей по сравнению с ПСП на чтение данных с программной предвыборкой на Athlon 64 X2 (7.6 ГБ/с). Заметно меньшей, по сравнению с Athlon 64 X2, оказывается и ПСП на запись данных методом прямого сохранения (5.0 против 6.9 ГБ/с). Таким образом, в условиях однопоточного доступа новый Phenom X4 в «спаренном» режиме работы контроллера показывает весьма неоднозначную картину. Что касается распаренного режима работы интегрированного контроллера памяти процессора, то наблюдаемое в этом случае величин ПСП на чтение является весьма закономерным, поскольку в данном случае (однопоточный доступ, один блок памяти) такой режим работы контроллера, фактически, аналогичен одноканальному режиму работы, теоретическая ПСП в котором составляет всего 6.4 ГБ/с. Несколько большая величина максимальной реальной ПСП на чтение (6.7 ГБ/с) обуславливается влиянием L3-кэша контроллера памяти процессора.

Заметим, что память типа DDR2-1066 в условиях наших тестов реально функционирует на частоте 480 МГц, т.е. в режиме «DDR2-960» (частота контроллера памяти 2400 МГц, делитель частоты = 5) с теоретической пропускной способностью 7.68 ГБ/с в одноканальном режиме и 15.36 ГБ/с в двухканальном. Первое, что бросается в глаза при рассмотрении результатов однопоточных тестов DDR2-1066 — это величины ПСП на запись данных методом прямого сохранения, которые оказываются практически равными величинам ПСП, достигаемым в этом тесте с памятью типа DDR2-800. Иными словами, они не зависят от частоты памяти и указывают на некое новое ограничение, по-видимому, присутствующее в самом ядре процессора (напомним, что на равночастотном Athlon 64 X2 4800+ достигаются большие значения этого показателя). В то же время, величины ПСП на чтение («спаренный» режим контроллера) закономерно возрастают: с 6.3 до 7.0 ГБ/с при «обычном» чтении и с 7.4 до 8.3 ГБ/с при чтении с программной предвыборкой. Однако следует заметить, что относительный прирост ПСП (примерно на 11% в обоих случаях) оказывается меньшим по сравнению с приростом в частоте памяти (с 400 до 480 МГц, т.е. на 20%). В распаренном режиме работы контроллера вновь наблюдаются величины ПСП, типичные для одноканального режима работы DDR2-1066 (несколько завышенные из-за влияния L3-кэша).

Перейдем к рассмотрению результатов тестов многопоточного доступа в память (двухпоточного в случае Athlon 64 X2, четырехпоточного — для Phenom X4, который, как показывают наши измерения, дает несколько лучшие результаты по сравнению с доступом в память лишь со стороны двух ядер процессора). В тестах DDR2-800 преимущества нового процессора AMD Phenom X4 очевидны: реальная ПСП на чтение составляет величины порядка 10.6-10.9 ГБ/с (против 6.8 ГБ/с на Athlon 64 X2); величины того же порядка достигаются и при использовании программной предвыборки данных (10.8-11.0 ГБ/с), что вновь говорит о сравнительно невысокой эффективности последней. Однако результаты максимальной реальной ПСП сами по себе, достигающие порядка 85% от теоретического максимума ПСП DDR2-800, говорят о крайне удачной реализации нового интегрированного контроллера памяти процессоров семейства Phenom X4. Не менее важно подробнее остановиться на том, что распаренный режим работы контроллера, который в однопоточных тестах фактически приравнивался к одноканальном режиму работы памяти, более таковым не является и в большинстве тестов демонстрирует даже несколько лучший результат. Причина этого явления достаточно очевидна: в многопоточном тесте каждое из ядер процессора обращается к собственному блоку данных, и каждое из ядер «обслуживается» собственным контроллером памяти (например, первое и второе ядро обращается к первому контроллеру, а третье и четвертое — ко второму).

Преимущества распаренного режима работы контроллера с индивидуальным «обслуживанием» ядер процессора двумя независимыми 64-битными контроллерами над спаренным режимом с представлением единого 128-битого контроллера всем ядрам процессора становятся еще более очевидными при переходе от DDR2-800 к DDR2-1066 (960). В этом случае величина ПСП на чтение с программной предвыборкой достигает внушительного значения — 13.14 ГБ/с. Это составляет примерно 85% от теоретической ПС двухканальной «DDR2-960» — похожий предел достигался и в тестах DDR2-800, независимо от режима работы контроллера. Однако в спаренном режиме для «DDR2-960» максимально достижимая ПСП составляет лишь 11.4 ГБ/с, т.е. примерно 74% от теоретического максимума.

Заключение

Обе из рассмотренных в настоящем исследовании новых платформ Intel и AMD оказались способны, в той или иной степени, приблизиться к раскрытию скоростного потенциала DDR2-800 и ее более высоких скоростных категорий. Использование 400-МГц системной шины на платформе Intel Core 2 Extreme QX9770 / Intel X48 позволило снять привычное ограничение на пропускную способность памяти, поскольку пропускная способность этой шины сравнялась с пропускной способностью двухканальной DDR2-800. Однако нельзя сказать, что это привело к кардинальному увеличению максимальной ПСП, реально достигаемой в тестах — она составила величину порядка 9.14 ГБ/с, т.е. всего 71% от теоретического максимума. Очевидно, что еще меньшее раскрытие скоростного потенциала памяти на этой платформе следует ожидать при использовании более высокоскоростных типов памяти DDR2 и, в особенности, DDR3, поскольку в этом случае 400-МГц системная шина окажется вдобавок ограничителем пропускной способности подсистемы памяти.

Несмотря на отдельные нюансы (например, сравнительно низкой эффективности программной предвыборки данных, а также ограничение со стороны ядра на ПСП при записи данных методом прямого сохранения), новая платформа AMD Phenom X4 смогла достичь значительно более внушительного раскрытия скоростного потенциала DDR2-800 и DDR2-1066. Наблюдаемый в целом прирост в реальной ПСП при однопоточном доступе в память является заслугой новой 128-битной однонаправленной шины L1-L2 кэша данных ядра процессора, а значительный прирост в ПСП при многопоточном доступе — следствием более эффективной реализации интегрированного контроллера памяти. Отдельного внимания заслуживает новый «распаренный» (unganged) режим работы этого контроллера, при котором интегрированный контроллер представлен двумя независимыми 64-битными контроллерами, способными одновременно обслуживать запросы в память разных ядер процессора. Как показывают результаты наших тестов, такой режим работы контроллера является фактически одноканальном при однопоточном доступе к одному блоку данных в оперативной памяти (и демонстрирует соответствующие величины реальной ПСП). Однако он становится значительно более эффективным при многопоточном доступе к нескольким блокам данных и даже превышает по своей эффективности «спаренный» (ganged) режим работы контроллера, который можно рассматривать как классический вариант 128-битного двухканального контроллера памяти. Особенно заметна эффективность распаренного режима работы контроллера при использовании более высокоскоростной памяти вроде DDR2-1066, в котором он способен достичь величин реальной ПСП, составляющей примерно 85% от теоретического максимума. Столь значительное раскрытие реального потенциала DDR2-800 и DDR2-1066 мы наблюдаем впервые, и мы наконец-то можем сказать, что интегрированный контроллер памяти процессоров AMD наконец-то оказался способен продемонстрировать свое неоспоримое преимущество над традиционной шинной архитектурой, применяемой в платформах Intel.




5 декабря 2007 Г.

DDR2-800/1066 Intel Core 2 Extreme QX9770 / Intel X48 AMD Phenom X4 - RightMark Memory Analyzer

DDR2-800/1066 Intel Core 2 Extreme QX9770 / Intel X48 AMD Phenom X4 — RightMark Memory Analyzer

DDR2-800 ( ) . DDR2 , - « » , .

Intel (FSB), ( , ) () DDR2. Intel 975X 965G 266 , 8.53 /. , (), . DDR2-800 (12.8 /), .

AMD DDR2 ( «AM2»). « » , , DDR2. , AMD «AM2» — Athlon 64 X2 Athlon 64 FX 2.0 2.8 , . , (64- ) L1-L2 , , DDR2-800. , «» , — , . , L1-L2 , Athlon 64 X2 L1- L2-. «» «» — , 15%, 70% . , « » .

, , DDR2-800 (, , ) Intel «» , , AMD «AM2» — AMD Athlon 64 X2 ( Athlon 64), DDR2. , Intel AMD. Intel Core 2 Extreme QX9770 3.2 , 45- Yorkfield Intel X48. 400 , DDR2-800. 2.4- AMD Phenom X4. ( , « » — L1-L2 ), .

1

  • : Intel Core2 Extreme QX9770 ( ), 3.2 (400 x8)
  • : Intel X48
  • : Gigabyte X48-DQ6 ( ), BIOS E4 30.10.2007
  • : 2x1 Corsair XMS2-6400, DDR2-800, 5-5-5-15

2

  • : AMD Phenom X4 9700 ( ), 2.4 (200 x12)
  • : AMD 790FX
  • : MSI K9A2 Platinum, BIOS V1.1B3 16.11.2007
  • : 2x1 Corsair XMS2-6400, DDR2-800, 5-5-5-15-2T
  • : 2x1 Corsair DOMINATOR XMS2-9136C5D DDR2-1066, 5-5-5-15-2T

Intel Core 2 Extreme QX9770 / Intel X48

DDR2-800, , , 400- . ( FSB:DRAM = 1:1), .

RightMark Multi-Threaded Memory Test : , (, Intel Core 2 , «» ), . , 64 ( , , 32+32 ) : «» (Read) (Read PF), «» (Write) , - (Write NT).

. 6.7 / ( ) — 7.3 / ( ). , , Intel Core 2 ( 6.0 — 6.8 /). 2.8 /, Intel, , 8.3 / (65% ). , Intel ( Pentium 4 Core 2) 2/3 , 400- Intel Core 2 Extreme QX9770 / Intel X48.

, — («2 , ») («2 , »). , . : 6- L2- , 6 L2- (.. 12 L2- ). , . , — (2.62 /), «» (2.78 /), , «» (3.46 /). , L2- , L2- .

, , «- » . , . , , , - , -, ( 25%), -, - . , (9.14 /) 71% . , , Intel Core 2 266- (8.33 /), , 333- / DDR2-667 (10.67 /). , Intel Core 2 «» 400- , .

AMD Phenom X4 2.4

, AMD ( , « » — L1-L2 ), . L1-L2 ( Phenom). .


, — ( 128- ) 7.99 / (15.98 / , L2 L1 L1 L2) , 4.7 (9.4) / . Athlon 64 X2 4.75 (9.5) / 4.55 (9.1) / .

L1-L2 Phenom, / (.. ). ( 2.4 ) 19.25 /, DDR2-1066 ( 17.6 /). , , L1-L2 AMD Phenom « » , .

, AMD Phenom ( Athlon 64) 128- . L1-L2, .


Phenom ( ), , « » L2- ( ) L2- — AMD. , 1- 2- 1- 48 . , L1-L2 Phenom 48 3 L1- ( - 3 ), .. « » 48/3 = 16 / ( — 128 ). , L1-L2 Athlon 64 « » 8 / ( — 64 ). , AMD Phenom L1-L2 — 64- ( Athlon 64) 128- .

AMD Phenom X4. , DDR2 ( DDR2-1066), DDR3, AMD Phenom X4 DDR2. 64- DDR2, :

  • , («» ) 64- ;
  • (ganged mode), «» 128- ;
  • (unganged mode), 64- .

, DDR2 . (ganged) — 64- «» ( , , ), 128 ( 64 ). , , () . 64- «» (DDR2 DDR3 , DDR2 DDR3 ) (, DDR2-800), / , . 64 — , . , (.. , ) 64- , .

AMD Phenom X4 L3- , , L1- L2- ( — 64 512 , ).

. AMD Phenom X4 DDR2-800, DDR2-1066, (DDR2-800 DDR2-1066). (ganged), (unganged) , ( ) ( ). , 64 (16+16+16+16 ) «» (Read) (Read PF), «» (Write) (Write NT).

DDR2-800 Phenom X4 «» «» Athlon 64 X2 4800+, — 6.3 / 3.9 /. , , L1-L2 . — ( «» — 7.4 6.3 /), Athlon 64 X2 (7.6 /). , Athlon 64 X2, (5.0 6.9 /). , Phenom X4 «» . , , ( , ) , , , 6.4 /. (6.7 /) L3- .

, DDR2-1066 480 , .. «DDR2-960» ( 2400 , = 5) 7.68 / 15.36 / . , DDR2-1066 — , , DDR2-800. , , -, (, Athlon 64 X2 4800+ ). , («» ) : 6.3 7.0 / «» 7.4 8.3 / . , ( 11% ) ( 400 480 , .. 20%). , DDR2-1066 ( - L3-).

( Athlon 64 X2, — Phenom X4, , , ). DDR2-800 AMD Phenom X4 : 10.6-10.9 / ( 6.8 / Athlon 64 X2); (10.8-11.0 /), . , 85% DDR2-800, Phenom X4. , , , . : , «» (, , — ).

«» 64- 128- DDR2-800 DDR2-1066 (960). — 13.14 /. 85% «DDR2-960» — DDR2-800, . «DDR2-960» 11.4 /, .. 74% .

Intel AMD , , DDR2-800 . 400- Intel Core 2 Extreme QX9770 / Intel X48 , DDR2-800. , , — 9.14 /, .. 71% . , DDR2 , , DDR3, 400- .

(, , ), AMD Phenom X4 DDR2-800 DDR2-1066. 128- L1-L2 , — . «» (unganged) , 64- , . , ( ). «» (ganged) , 128- . DDR2-1066, , 85% . DDR2-800 DDR2-1066 , - , AMD - , Intel.