Новое ядро Athlon 64

Внедрение новой технологии производства с нормами 90 нм компания AMD начала еще в начале этого года, выпустив обновленную серию процессоров Athlon 64 с двухканальным контроллером памяти и, соответственно, разъемом Socket 939. Однако первая версия ядра, известная под кодовым именем Winchester, просуществовала недолго. Уже в конце весны в продаже начали появляться процессоры с новым ядром Venice. Что интересно, помимо чисто технологических улучшений, AMD внесла ряд изменений в архитектуру процессора. И если часть из них имеют косметический характер, то некоторые модификации представляют интерес для любителей оптимизации и разгона. О них и поговорим.


Новая технология

Первые версии процессоров Athlon 64 производились по технологии с нормами 130 нм и использованием дополнительной изоляции подложки (SOI, Silicon-on-Insulator). Эта технология была разработана AMD совместно с IBM и успешно внедрена на собственных фабриках. Впрочем, прогресс не стоит на месте. Новая технология с нормами 90 нм позволила уменьшить энергопотребление и улучшить частотные показатели микросхем, что было необходимо для дальнейшего развития линейки процессоров AMD.

Впервые эта технология начала применяться в настольных процессорах Athlon 64 с разъемом Socket 939. Ядро ревизии D0 (Winchester) по энергопотреблению значительно превзошло предыдущие ядра процессоров Athlon 64 именно благодаря новой технологии производства. Однако частотные характеристики этого ядра оказались не столь впечатляющими, из-за чего AMD не удалось наладить выпуск на его базе процессоров с частотой выше 2.2 ГГц.

После тщательной доработки технологии и внедрения в нее методов уплотнения кристаллической решетки разработчикам удалось улучшить параметры выпускаемых процессоров. Новые ревизии процессорных ядер, начиная с DH-E3 "Venice", стали использоваться в процессорах с более высокими тактовыми частотами, причем при снижении напряжения Vcore до 1.4 В (ряд процессоров работает при напряжении 1.35 В). А потом, начиная с E4, появились варианты с различным объемом кэша L2 - SanDiego (1 Мб) и Palermo (256 или 128 Кб). Так, процессоры Athlon 64 FX-57 (2.8 ГГц), FX-55 (2.8 ГГц), Athlon 64 4000+ и 3800+ (оба - 2.4 ГГц) были обновлены только после появления новой технологии. Кроме того, она же была применена при создании двухъядерных процессоров Athlon 64 X2 (ядро Toledo).

Интересно, что в процессорах Athlon 64 с разъемом Socket 754 такая технология не применяется, но она легла в основу целого ряда новых процессоров Sempron. Это однозначно говорит о том, что AMD собирается в дальнейшем развивать линейку процессоров Athlon 64 только для Socket 939.


Новые инструкции

Начиная с ядра E3 (Venice), процессоры Athlon 64 и Sempron стали поддерживать новый набор инструкций - SSE3. Эти инструкции впервые были применены в процессорах Pentium 4, а точнее, в новом 90 нм ядре Prescott. Компания AMD решила не отставать от конкурента, и в новом ядре тоже реализовала поддержку SSE3. Новые инструкции, относясь к категории SIMD (пакетная обработка матриц и векторов), при наличии поддержки в программном обеспечении способны ускорить обработку мультимедийных данных. Конечно, далеко не все программы, даже соответствующего профиля, могут получить реальную пользу от использования SSE3.


Новый контроллер памяти

В новых ядрах разработчики провели дальнейшую работу над совершенствованием контроллера памяти. Поддержка нового стандарта DDR2 (по крайней мере, на момент написания статьи, когда последней ревизией была E6), в процессорах Athlon 64 пока не реализована. Разработчики только улучшили механизмы буферизации и аппаратной предвыборки данных, а также повысили нагрузочную способность - добавили возможность поддержки четырех банков памяти DDR с задержкой Command Rate=1T. Дело в том, что раньше контроллер памяти не справлялся за один такт с генерацией номера кристалла (полного физического адреса данных в памяти), если количество модулей DIMM было больше трех. Приходилось вводить дополнительную задержку - фиксировать номер кристалла по обратному фронту сигнала. Если же модули были двухбанковые (всего 8 банков), частоту приходилось снижать до 333 МГц либо использовать дорогую регистровую память. В новых ядрах, начиная с E3, эта проблема была решена.

Еще одна немаловажная, но пока недокументированная возможность имеется у контроллера памяти новых Athlon 64. Заключается она в поддержке более высокой, чем 200 МГц, частоты памяти. И вот как она была реализована.

Как известно, у 64-разрядных процессоров AMD отсутствует как таковая процессорная (системная) шина. Полная тактовая частота ядра формируется путем умножения частоты шины HyperTransport, внешнего канала процессора, на заданный производителем множитель (этот множитель можно изменять на понижение, что дает возможность гибко управлять частотами шин в системе). Тактовая частота памяти отсчитывается уже не от частоты процессорной шины, а от полной частоты процессора путем деления ее на целое число: 10 для процессора 2 ГГц, 12 для процессора 2.4 ГГц и т.д. Это целое число получается как результат деления и округления к большему целому текущего множителя процессора на коэффициент частоты памяти:

DDR=CPU/ОКРВВЕРХ(Ratio/MemDiv), где DDR - частота памяти, CPU - частота процессора, Ratio - множитель процессора, MemDiv - делитель памяти.

Если пренебречь результатами округления, формулу можно свести к более простому виду:

DDR=HT*MemDiv, где HT - частота шины HyperTransport.

Конкретный коэффициент деления задается пользователем через BIOS Setup. Он может составлять 1 (DDR=200), 5/6 (DDR=166), 2/3 (DDR=133), 1/2 (DDR=100), а также 4/3 (DDR=150), но этот делитель недокументирован. Как видите, все делители частоты памяти меньше либо равны 1, в результате чего пользователь не может установить частоту памяти выше частоты шины HyperTransport.

В то же время на рынке доступны модули памяти с неофициальной поддержкой частот 233, 250 и даже 266 МГц. Ряд модулей DDR400, особенно с чипами некоторых серий Winbond и Samsung, стабильно работает и на более высоких частотах при повышении напряжения выше номинала. Идя навстречу пользователям, разработчики AMD добавили несколько делителей больше 1: 13/12, 7/6, 5/4 и 4/3. C их помощью частоту памяти можно довести до 266 МГц! (Впрочем, не для всех моделей процессоров - из-за упомянутого выше округления. Например, при частоте процессора 2.2 ГГц применение самого большого множителя 4/3 дает всего 244.4 МГц.)

Конечно, поднять частоту памяти можно и без новых множителей - достаточно понизить множитель процессора и повысить частоту шины HyperTransport. Однако это уже разгон, и не все системы будут работать в таком режиме стабильно.

Добавление недокументированных множителей лежит на совести разработчиков материнских плат. На оверклокерских платах они, безусловно, имеются, а на стандартных моделях могут и отсутствовать.


Тестирование

Собственно, тестовая материнская плата DFI NF4-DAGF не имела поддержки новых множителей, хотя процессор на ядре E3 распознавала нормально. В состав тестовой конфигурации также входили: пара модулей памяти DDR400 по 256 Мб, как раз с "оверклокерскими" чипами памяти, видеокарта GeForce 6600 PCI Express, жесткий диск Seagate Barracuda 7200.7. Тестирование проводилось в 32-битной среде под управлением Windows XP SP1.

В тесте участвовали два процессора, оба - Athlon 64 3500+, но на разных ядрах. Первый - на 130 нм ядре NewCastle, второй - на 90 нм Venice. Паспортные параметры процессоров представлены в таблице.

Название Athlon 64 3500+ Athlon 64 3500+
Маркировка ADA3500DEP4AW ADA3500DAA4BP
Ядро NewCastle Venice
Ревизия DH-CG DH-E3
Частота 2.2 ГГц 2.2 ГГц
Частота шины HT 1 GT/s (200 МГц) 1 GT/s (200 МГц)
Множитель 11х 11х
Кэш L2 512 Кб 512 Кб
Напряжение 1.5 В 1.35 В
Потребление 89 Вт 67 Вт
Макс. температура 70 гр. C 70 гр. C
Технология 130 нм SOI 90 нм SOI
Сокет 939 939

Из всех проведенных тестов были отобраны только два - PCMark04 Pro и SPECviewperf 8.01. Особенность этих тестов в том, что они в большей степени зависят от производительности процессора, нежели от других подсистем - дисковой, памяти и т.д. В частности, замечено, что системы с одинаковым процессором, но разными материнскими платами в этих тестах обычно показывают максимально близкие результаты. Оба теста также ценны тем, что в них используется код из реальных приложений.

DFI NF4-DAGF, 512 Mb DDR400, GeForce 6600 Ядро NewCastle Ревизия CG, 130 нм Ядро Venice Ревизия E3, 90 нм Разница, %
PCMark04 Pro
PCMark04 score 4204 4267 1.5%
- File Compression 3.17 3.26 2.8%
- File Encryption 34 34.1 0.3%
- File Decompression 26.8 27.5 2.6%
- Image Processing 13.39 13.4 0.1%
- Virus Scanning 23.82 23.65 -0.7%
- Grammar Check 3.48 3.45 -0.9%
- File Decryption 67.9 68.2 0.4%
- Audio Conversion 28.97 29.11 0.5%
- Web Page Rendering 5.24 5.47 4.4%
- WMV Compression 52.5 52.8 0.6%
- DivX Compression 64 65.4 2.2%
- Physics & 3D 19.2 19.4 1.0%
SPECViewperf 8.01
SPECViewperf: 3ds MAX 14.4 14.6 1.4%
- Catia 12.1 12.3 1.7%
- Ensight 8.26 8.36 1.2%
- Light 11.3 11.6 2.7%
- Maya 23.75 24.2 1.9%
- ProEng 17.37 17.7 1.9%
- Sw 10.77 10.9 1.2%
- Ugs 4.24 4.27 0.7%

Как и следовало ожидать, разница в производительности двух процессоров невелика - в редких случаях она доходит до 2-2.5%. Объясняется это и доработанным контроллером памяти, и поддержкой SSE3.

Результаты разгона двух процессоров тоже различаются. Процессор с ядром NewCastle удалось заставить работать на частоте 2.6 ГГц, увеличив частоту шины HT с 200 до 236 МГц. А процессор с ядром Venice заработал на частоте 2.86 ГГц (шина HT 260 МГц). В обоих случаях напряжение питания было увеличено до 1.63 В.


Выводы

Технологический прогресс в линейке процессоров Athlon 64 в исполнении Socket 939 очевиден. Новое ядро Venice отличается меньшим энергопотреблением и более высоким частотным потенциалом. Но по производительности отличия незначительны, в среднем, не более пары процентов. Впрочем, это закономерно, поскольку серьезных архитектурных нововведений ядро не содержит.

Макс КУРМАЗ,
[email protected]

Версия для печатиВерсия для печати

Номер: 

36 за 2005 год

Рубрика: 

Hardware
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!