Наше первое исследование интегрированного контроллера памяти новой ревизии процессоров AMD Athlon 64 X2/FX, ориентированного на память типа DDR2 (от DDR2-400 до DDR2-800), проведенное совсем недавно, выявило весьма посредственные характеристики подсистемы памяти на новой платформе AMD. Согласно сделанным нами предположениям, отчасти это связано с «узостью» 64-битной двунаправленной шины L1-L2 кэша данных (ее теоретическая пропускная способность напрямую зависит от частоты ядра), отчасти — с самой частотой ядра. Как мы показали, пропускная способность современной высокоскоростной двухканальной DDR2 уже оказывается сопоставимой со скоростью передачи данных внутри самого процессора. «Подтянуть» последнюю, не выходя за пределы текущей архитектуры (по-прежнему «K8», пусть уже и двухъядерной), по-прежнему можно разве что путем повышения частоты ядра. При этом возрастут скоростные показатели всех уровней подсистемы памяти процессора — L1 и L2 кэша, а дополнительным бонусом станет во столько же раз кратное увеличение частоты контроллера памяти, что благоприятно скажется на характеристиках последнего уровня подсистемы памяти — оперативной памяти как таковой.
Наше сегодняшнее исследование отличается от предыдущего, по сути, заменой процессора Athlon 64 X2 4000+ (частота ядра 2.0 ГГц) новым процессором серии «FX» Athlon 64 FX-62 (частота ядра 2.8 ГГц, что в 1.4 раза выше) при сохранении остальных компонентов платформы в почти неизменном виде. Итак, посмотрим, сможем ли мы ожидать от 40% повышения частоты ядра (а различие между процессорами Athlon 64 X2 4000+ и FX-62, по сути, заключается только в этом) сопоставимого прироста (порядка 40%) в главной характеристике подсистемы памяти — максимально достижимой реальной пропускной способности.
Конфигурации тестовых стендов
Тестовый стенд №1
- Процессор: AMD Athlon 64 X2 4000+ (ревизия ядра «F»), Socket AM2
- Чипсет: NVIDIA nForce 570 SLI
- Материнская плата: MSI K9N SLI Platinum
- Память: 2x1024 МБ Corsair XMS2 PRO PC2-6400 DDR2-800 (5-5-5-12)
Тестовый стенд №2
- Процессор: AMD Athlon 64 FX-62 (ревизия ядра «F»), Socket AM2
- Чипсет: NVIDIA nForce 570 SLI
- Материнская плата: MSI K9N SLI Platinum
- Память: 2x1024 МБ Kingston HyperX PC2-6400 DDR2-800 (4-4-4-12)
Результаты тестирования
Тестирование двухканальной DDR2-800 на новой платформе AMD Athlon 64 FX-62 (стенд №2) было решено проводить в двух наиболее скоростных режимах: DDR2-667 (ожидаемая реальная частота памяти — 311 МГц, то есть «622 МГц» в терминах DDR) и DDR2-800 (ожидаемая реальная частота совпадает с номинальной, 400 МГц). Кроме того, по сравнению с предыдущим исследованием, в каждом из этих режимов использовались две схемы таймингов — 5-5-5-12 (идентичная схеме, применяемой в прошлом исследовании) и 4-4-4-12 (номинальная для модулей памяти Kingston DDR2-800). Для сравнения, в приведенной ниже таблице представлены результаты предыдущего тестирования памяти Corsair DDR2-800 в режимах DDR2-667 и DDR2-800 с процессором Athlon 64 X2 4000+ (стенд №1).
Параметр/Режим | Стенд №1 | Стенд №2 | ||||
---|---|---|---|---|---|---|
DDR2-667 | DDR2-800 | DDR2-667 | DDR2-800 | |||
Тайминги | 5-5-5-12 | 5-5-5-12 | 5-5-5-12 | 4-4-4-12 | 5-5-5-12 | 4-4-4-12 |
Теоретическая ПСП, МБ/с | 10667 | 12800 | 9955* | 9955* | 12800 | 12800 |
Средняя ПСП на чтение, МБ/с | 3368 | 3590 | 3693 | 3883 | 4137 | 4393 |
Средняя ПСП на запись, МБ/с | 2759 | 2909 | 3202 | 3311 | 3514 | 3760 |
Макс. ПСП на чтение, МБ/с | 6590 (61.8 %) | 6819 (53.3 %) | 7405 (74.4 %) | 7876 (79.1 %) | 8382 (65.5 %) | 8777 (68.6 %) |
Макс. ПСП на запись, МБ/с | 5758 (54.0 %) | 5790 (45.2 %) | 7874 (79.1 %) | 7999 (80.4 %) | 8039 (62.8 %) | 8070 (63.0 %) |
Минимальная латентность псевдослучайного доступа, нс | 31.8 | 28.8 | 30.7 | 28.6 | 27.4 | 24.7 |
Максимальная латентность псевдослучайного доступа, нс | 35.1 | 31.9 | 34.0 | 31.9 | 30.4 | 27.6 |
Минимальная латентность случайного доступа**, нс | 96.3 | 85.3 | 91.6 | 88.0 | 76.2 | 74.2 |
Максимальная латентность случайного доступа**, нс | 99.5 | 88.5 | 97.3 | 91.7 | 78.8 | 76.4 |
*реальная частота памяти 311 МГц (2800/9)
**размер блока 32 МБ
Невооруженным глазом видно, что использование более высокой частоты ядра действительно позволяет улучшить скоростные характеристики подсистемы памяти. В режиме DDR2-667 максимальная теоретическая ПСП, как ни странно, наблюдается при записи данных в память (подобную картину мы видели в предыдущем исследовании в «младших» режимах вроде DDR2-400, но не DDR2-667) и достигает примерно 7.9 ГБ/с. Что интересно, использование более скоростной схемы таймингов 4-4-4-12 против 5-5-5-12 приводит к ощутимому увеличению ПСП при чтении данных (с 7.4 до 7.9 ГБ/с). Как показывают наши многочисленные исследования памяти DDR2 на платформе Intel, подобный эффект на последней практически не наблюдается. Так что различия в контроллерах памяти и способах организации подсистемы памяти, как говорится, налицо.
Итак, в режиме DDR2-667 на процессоре Athlon 64 FX-62 нам удалось достичь максимальную реальную ПСП, составляющую почти 80% от теоретической пропускной способности памяти DDR2, функционирующей на частоте 311 МГц. Относительно 2-ГГц ядра Athlon 64 X2 4000+, отношение максимальных величин ПСП составляет примерно 1.17 раз (при соотношении частот ядер, равном 1.4). Таким образом, повышение частоты ядра явно способствует увеличению реальной пропускной способности подсистемы памяти, но коэффициент пропорциональности между увеличением ПСП и увеличением частоты ядра оказывается явно меньше единицы (если быть точным, он равен 1.17/1.4 = 0.84). Кроме того, само 80% «раскрытие потенциала» DDR2-667, хотя и выглядит достаточно впечатляюще, все же оказывается хуже по сравнению с тем, что уже давно можно увидеть на платформе Intel с 266-МГц частотой FSB, где легко достигается реальная ПСП, практически идентичная теоретической ПС процессорной шины (8.53 ГБ/с).
Перейдем к режиму DDR2-800. С одной стороны, в этом случае «раскрытие потенциала» (учитывая, сколь велик сам потенциал) выражено в заметно меньшей степени. Максимально достижимая реальная ПСП оказалась равной примерно 8.4-8.8 ГБ/с при операциях чтения и 7.9-8.0 ГБ/с при операциях записи (эти две величины вновь поменялись местами, только на данной платформе точка достижения «преимущества чтения над записью» сместилась в область более высоких частот памяти). Это составляет всего 63-69% от теоретической ПСП, равной 12.8 ГБ/с, а также не очень сильно опережает реальную ПСП, достигаемую на платформе Intel (8.53 ГБ/с). Так что о явном преимуществе в пропускной способности нового интегрированного контроллера AMD над традиционной «шинной» организацией подсистемы памяти на платформе Intel говорить все еще не приходится. С другой стороны, прирост в ПСП относительно первой исследованной платформы в данном случае оказывается заметнее — он составляет 1.28 раз, то есть в большей степени соответствует 1.4-кратному увеличению частоты ядра процессора. Как говорится, мелочь, а приятно.
Напоследок, несколько слов о задержках при псевдослучайном и случайном доступе к памяти. Как видно из приведенной таблицы, в режиме DDR2-667 при идентичности таймингов они достаточно мало отличаются от результатов предыдущего исследования. Уменьшение таймингов до 4-4-4-12 приводит к некоторому уменьшению задержек во всех случаях (особенно выраженному — при случайном доступе), что согласуется с данными многочисленных исследований DDR2 на платформе Intel. Вместе с тем, в режиме DDR2-800 задержки при случайном доступе изначально оказываются заметно меньшими (при сохранении схемы таймингов 5-5-5-12), а их дальнейшее уменьшение при переходе к схеме таймингов 4-4-4-12 оказывается уже весьма незначительным. Таким образом, увеличение тактовой частоты контроллера памяти (в данном случае ключевую роль играет именно частота контроллера памяти, а не ядра процессора) способствует снижению задержек при доступе в память, что можно считать дополнительным преимуществом. В абсолютных величинах задержек преимущество интегрированного контроллера AMD перед «чипсетным» Intel, таким образом, становится еще более ощутимым.
Заключение
Наше сегодняшнее исследование двухканальной DDR2-800 с процессором Athlon 64 FX-62 в сравнении с предыдущим исследованием на процессоре Athlon 64 X2 4000+ показало, что раскрытие реального потенциала (пропускной способности) памяти DDR2 на этой платформе в немалой степени зависит от частоты ядра процессора (и контроллера памяти). Вместе с тем, относительный прирост ПСП оказывается менее выраженным по сравнению с относительным приростом частоты процессора. Не столь впечатляюще, для 2.8-ГГц ядра процессора, выглядят и абсолютные величины ПСП — они едва превышают отметку, давно поставленную платформой Intel с 266-МГц частотой FSB (8.53 ГБ/с) и по-прежнему весьма далеки от теоретического максимума в 12,8 ГБ/с для двухканальной DDR2-800, не говоря уж о более высокочастотной DDR2 и, тем более, будущей DDR3. Таким образом, говорить о полном раскрытии потенциала высокоскоростной DDR2 на платформе AMD снова не приходится. Радикальным выходом из сложившейся ситуации может стать разве что модернизация архитектуры ядра. Пока же остается надеяться на то, что «два ядра лучше, чем одно», в том смысле, что столь высокий скоростной потенциал DDR2 может стать реально востребованным при одновременном интенсивном обращении к подсистеме памяти одновременно со стороны обоих ядер (однако в реальной жизни такие задачи еще предстоит поискать). Мы постараемся вернуться к этой теме в наших дальнейших исследованиях.