Канадская фирма ATI Technologies, лидируя на рынке OEM-видеокарт для "брэндовых" компьютеров, начало эры игровых 3D-ускорителей прозевала. Сначала 3Dfx, потом nVidia захватили лидерство в этой области. Выход первого серьезного 3D-ускорителя ATI Rage128 произошел слишком поздно и уже не мог ничего изменить. То же самое случилось и с Rage128 Pro: опоздание, драйверы не готовы, производительность не дотягивает до уровня лидера - Riva TNT2. Зато третья попытка - чип Radeon256 - позволила ATI всерьез заявить о себе как о потенциальном лидере на рынке производительных игровых и профессиональных 3D-ускорителей, так как по уровню производительности он стоит на одной ступени с нынешним лидером - чипом nVidia GeForce2.
Ядро Rage6C
Ядро нового чипа - Rage6C - несет в себе некоторые революционные нововведения, о которых мы писали в "КВ" №18 за 2000 год. Вкратце напомню его ключевые параметры.
Конвейеры. Чип Rage6C имеет два конвейера рендеринга, у каждого из которых, в свою очередь, три блока текстурирования. В итоге за один проход Rage6C может накладывать шесть текстур - по три на пиксел. У GeForce2 GTS четыре конвейера, но с двумя блоками текстурирования. Тем самым, в современных играх Radeon не может тягаться с GeForce2, так как наложение трех текстур одновременно практически нигде не используется. GeForce2 будет обрабатывать по четыре пиксела, а Radeon - по два. Зато при необходимости наложения трех текстур Radeon сможет обработать два пиксела, как и GeForce2.
Блок T&L. Rage6C имеет в составе блок Charisma Engine, который выполняет преобразование координат вершин треугольников, расчет освещения и отсечение - как и блок T&L второго поколения в чипах nVidia. Зато заявленная производительность этого блока - 30 млн треугольников в секунду - выше аналогичного параметра блока T&L у GeForce2 GTS (25 млн).
Hyper-Z. А вот то, чего не хватает хваленому GeForce'у - механизм эффективной работы с Z-буфером Hyper-Z, позволяющий существенно уменьшить нагрузку на пропускную способность памяти. Если говорить кратко, Z-буфер служит для определения перекрытия одних поверхностей трехмерной сцены другими. Каждому пикселу назначается атрибут, указывающий его координату по оси Z (идущей из глубины сцены по направлению к зрителю). Тот пиксел, который ближе к зрителю, должен перекрыть все пикселы, расположенные в той же точке, но дальше по оси Z. Типичное значение перекрытия - 3, то есть два пиксела из трех были обработаны зря - их объект был заслонен другим, более близким объектом.
Так вот, ATI разработала механизм оптимизации работы Z-буфера. Hyper-Z состоит их трех механизмов. Hierarchical-Z предполагает проверку перекрытия пиксела до его поступления на обработку - заведомо невидимые пикселы обрабатываться не должны. Z-Compression предполагает сжатие хранимой в Z-буфере информации. Fast Z-Clear является алгоритмом быстрой очистки содержимого Z-буфера перед началом работы со следующим кадром. В итоге применение Hyper-Z увеличивает производительность Radeon (по имеющимся данным) на 15-20%.
Но есть сведения, что один из компонентов Hyper-Z, а именно Hierarchical-Z, в нынешней версии ядра не работает. Я заглянул в настройки драйвера и обнаружил, что эта возможность действительно отключена. В следующей версии ядра ошибка будет исправлена.
Есть у Rage6C некоторые другие особенности - в частности, поддерживается имитация рельефа текстур методом Environmental Bump Mapping.
Само ядро выполнено по техпроцессу 0.18 мкм, имеет 30 млн транзисторов, потребляет всего 8 Ватт - вдвое меньше NV15 (GeForce2).
Видеокарта Radeon 32 DDR
Как известно, видеокарты на чипах ATI выпускаются только самой ATI, что гарантирует достойное качество и... не самую низкую цену. Не стал исключением и чип Radeon256.
Имеет смысл сделать одно замечание. Видеокарты с 64 Мб памяти на борту, а также остальные, поставляемые в коробках (Retail-версии), имеют частоту и чипа 183 МГц (если память - DDR, то, соответственно, 366 и 183 МГц) благодаря применению памяти 5.5 нс. Зато OEM-версии с памятью 6 нс работают на пониженной частоте - 166 МГц (память DDR - 333 МГц). Это связано с тем, что память должна работать на той же частоте, что и чип Radeon256.
У меня побывал образец видеокарты Radeon 32 DDR, то есть OEM-версия с 32 Мб памяти DDR. Итак, видеокарта имеет небольшие размеры (по сравнению с GeForce2 GTS), четыре чипа памяти производства Samsung Electronics (DDR, 6 нс, 64 Мбит, с одной стороны платы - в отличие от GeForce2 GTS). На плате есть место для видеочипа ATI Rage Theater, обеспечивающего неплохие возможности по вводу, выводу и обработке телевизионного видеосигнала. Радиатор на чипе совсем небольшой, как и вентилятор, но достаточный для того, чтобы охлаждать Rage6C.
Испытания
Перейду непосредственно к испытаниям. Видеокарта - выставочный экземпляр, показанный на PTS'2000 - устанавливалась в систему на базе процессора Intel Celeron-600 и чипсета i815, использовались драйверы версии 4.12.3063, операционная система - Windows 98 SE.
Качество и четкость изображения у ATI Radeon на высоте, что, впрочем, свойственно видеокартам этой марки. Качество 3D-рендеринга визуально неотличимо от эталона - nVidia GeForce2. Никаких проблем со стабильностью работы или с несовместимостью с 3D-играми я не наблюдал, хотя ATI продолжает исправлять драйверы до сих пор, так как все еще есть игры, и ATI это признает, которые некорректно работают с Radeon. В этом плане nVidia все-таки лучше.
Я привожу результаты измерения производительности Radeon в DirectX и OpenGL.
Сравнение ATI Radeon с GeForce2 GTS | |||
ATI Radeon 32 DDR |
GeForce2 GTS (Gigabyte GF2000) |
Разница, % | |
3DMark-2000 (DirectX и T&L) | |||
640x480x16bit, Hardware T&L | |||
Game1 Medium | 56.7 | 57.8 | -2% |
Game2 Medium | 44.2 | 46.6 | -5% |
Fillrate (single texture) | 256 | 561.4 | -54% |
Fillrate (multiple textures) | 542 | 1102 | -51% |
Polygon T&L 1 light | 6364 | 7647 | -17% |
Texturing 16 Mb | 195 | 189 | 3% |
1280x1024x16bit, Hardware T&L | |||
Game1 Medium | 44 | 56.2 | -22% |
Game2 Medium | 40.4 | 45.4 | -11% |
Fillrate (single texture) | 262 | 546 | -52% |
Fillrate (multiple textures) | 554 | 1138 | -51% |
Polygon T&L 4 light | 3483 | 5159 | -32% |
Polygon T&L 8 light | 2807 | 2845 | -1% |
Texturing 16 Mb | 157.7 | 193.3 | -18% |
Bump mapping 2 pass | 147 | 186.2 | -21% |
1280x1024x32bit, Hardware T&L | |||
Game1 Medium | 42 | 41.7 | 1% |
Game2 Medium | 38.6 | 40 | -4% |
Fillrate (single texture) | 250 | 204.8 | 22% |
Fillrate (multiple textures) | 525 | 425.5 | 23% |
Polygon T&L 4 light | 3310 | 4592 | -28% |
Polygon T&L 8 light | 2700 | 2708 | 0% |
Texturing 16 Mb | 133.5 | 123 | 9% |
Texturing 32 Mb | 113.3 | 74.3 | 52% |
Bump mapping 3 pass | 85.5 | 63.3 | 35% |
Bump mapping 2 pass | 105.7 | 86.6 | 22% |
Quake2 800x600x32bit | |||
massive1 | 80.2 | 108 | -26% |
crusher | 48.9 | 62.1 | -21% |
Quake3 Arena | |||
640x480x16bit | 62.9 | 66.1 | -5% |
1024x768x16bit | 57.7 | 64.8 | -11% |
1024x768x32bit | 57.3 | 63.8 | -10% |
1280x1024x16bit | 46.3 | 63.6 | -27% |
1280x1024x32bit | 45.3 | 52 | -13% |
Конечно, моя тестовая конфигурация далека от идеала (в особенности слабоват процессор), так что тесты не могут претендовать на большую точность и достоверность, но общая тенденция просматривается. Отмечу два момента.
Первый - с 32-битным цветом Radeon работает заметно лучше, чем это делает GeForce2, и не последнюю роль в этом играет Hyper-Z. С ростом разрешения и, вместе с ним, нагрузки на 3D-ускоритель разрыв между GeForce2 и Radeon в 16-битном цвете возрастает, а в 32-битном - снижается, кое-где Radeon обходит GeForce2. Сказывается узкое место GeForce2 - пропускная способность памяти.
Второй - при существенном отставании по частоте чипа (166 против 200 МГц) Radeon вплотную подбирается к GeForce2 GTS на высоких разрешениях при использовании 32-битного цвета. При более мощном, чем у меня, процессоре Radeon способен обойти GeForce2. Тут нужно заметить, что использованная мной стандартная demo001 из Quake3 не может серьезно нагрузить современный 3D-ускоритель. В Сети появились результаты испытаний нескольких видеокарт на специально подготовленном уровне Quake3 - с большими текстурами и сложными моделями, и в результате Radeon обошел конкурентов более чем в два раза.
В целом можно легко заметить, что при сопоставимых ценах уровень производительности у Radeon приблизительно соответствует производительности GeForce2 GTS в 32-битном цвете.
Вывод
Проверив Radeon в действии, я пришел к выводу, что это очень достойная видеокарта, способная составить конкуренцию флагману nVidia - GeForce2 GTS. Нормальные драйверы, хорошая совместимость (проблемы с чипсетами VIA, насколько мне известно, уже решены), приличная производительность, несколько интересных возможностей. Цена соответствует аналогу от nVidia, при этом качество ничуть не хуже - "Радеоны" производятся только самой ATI.
Интересен тот факт, что Radeon может составить конкуренцию и другому продукту nVidia - GeForce2 MX. Недавно был выпущен вариант Radeon 32 SDR, который имеет на борту недорогую SDRAM-память, тот же самый чип, а цена - $150 - примерно соответствует уровню видеокарт на GeForce2 MX. Результаты испытаний показали совсем небольшое отставание Radeon 32 SDR от GF2MX.
Но и это еще не все. Готовится к выпуску чип RV100 (Radeon LT) - урезанная версия Radeon, которая должна оказаться еще дешевле. Да и новый чипсет - ATI ArtX2 - должен иметь в своем составе ядро Radeon.
Макс КУРМАЗ,
max_kurmaz@mail.ru,
hardware@kv.minsk.by
Видеокарта ATI Radeon предоставлена фирмой "Конструктив"