Контакти;

Все для мобілки: Мобільні новини; Каталог WAP-ресурсів; Розповіді про мобілки; Різне.

 
Все для компьютера: Жосткі диски; Процесори; Графіка; Принтери; Системні плати; Інтернет; Різне.
 
Україна: Нам пора для України жити! Вірші Констянтина Гайя; Ностальгія за минулим; Політика;

Основні розділи:

Конгрес Українських Націоналістів Rambler's Top100
Рейтинг@Mail.ru Украина онлайн

© Лихач М.В. sem@shynok.com.ua 2004рік

Будущее за ATI R420!

Архитектура ATI RadeonX800.

Уже позади эйфория по поводу первых тестов NV40. Все смогли убедиться в том, что новое решение от NVIDIA в ряде тестов действительно быстрее своих предшественников ровно в два раза, а в некоторых случаях даже больше. Фантастические характеристики нового чипа подтвердились не менее фантастической производительностью в ряде ЗD-приложений, и многие пользователи и аналитики начали серьезно сомневаться в том, сможет ли компания ATI дать достойный ответ. У карт GeForce 6800 Ultra и GeForce 6800 на базе чипа NV40 имелась также аппаратная поддержка пиксельных и вершинных шейдеров версии 3.0, которые будут включены в следующую версию DirectX 9.0 с индексом "С", что ставило чип ATI в не самое выгодное положение, учитывая отсутствие поддержки таковых в R420. Однако все напряженно ждали, когда же к обозревателям придет канадский ответ на калифорнийское чудо. И, как оказалось, ждали совсем не зря, поскольку результаты первых тестов нового продукта заставили многих задуматься о том, а кто же, собственно, будет править на рынке видеоакселераторов (уже устаревающее понятие, поскольку сейчас практически любая видеокарта является акселератором) в обозримом будущем... Согласитесь, вопрос для большинства далеко не риторический, так как вне зависимости от наших желаний играть в игры хочется практически всегда! Как и в случае с NV40, канадский чип ATI R420 представлен сразу двумя модификациями: ATI Radeon X800 XT и ATI Radeon X800 PRO. Первое решение - это прямой конкурент видеокарты NVIDIA GeForce 6800 Ultra, a no совместительству самое высокотехнологичное произведение на базе чипа ATI R420. Карта так же, как и NVIDIA GeForce 6800 Ultra, имеет 16 пиксельных конвейеров и 6 вершинных процессоров, однако частотные характеристики явно не в пользу NVIDIA GeForce 6800 Ultra. ATI Radeon X800 PRO -это уже урезанное решение на базе чипа R420. Нужно отметить, что в своей новой линейке компания ATI отказалась от традиционного для прошлого поколения чипов деления hi-end-решений по частотам работы ядра и памяти. На этот раз в числе урезаемых характеристик оказался и такой принципиально важный для производительности GPU параметр, как количество пиксельных конвейеров. Вместо 16 ATI Radeon X800 PRO содержит 12 пиксельных конвейеров. Лучшие умы человечества на данный момент находятся в поисках способа решения включения дополнительных конвейеров на видеокарте Radeon X800 PRO, и похоже, что поиски уже дали чрезвычайно интересные и, можно даже сказать, познавательные результаты. Как видим, компания ATI в своей новой линейке видеокарт также внесла существенные изменения в маркировку чипов. Налицо полный отказ от прежней маркировки чипов, в отличие от NVIDIA, которая ее в целом сохранила, но отказалась от приставки FX, имеющей, видимо, по мнению аналитиков NVIDIA, плохую карму. Хорошо это или плохо - сказать трудно, но, как нам кажется, проблем с распознаванием новых карт на базе чипа R420 будет не очень много, благо и приставки PRO и XT остались на месте.

 

ТТХ чипов: R420 vs. NV40

Если взглянуть на основные стороны чипов обеих компаний, то приходишь к выводу о том, что решения, предлагаемые на сегодняшний день ATI и NVIDIA, разработаны со строгой оглядкой на продукты конкурента. Судите сами: блоки геометрической обработки у обоих графических процессоров имеют одинаковое число вершинных процессоров -шесть. По сравнению с решениями предыдущего поколения, ATI увеличила количество вершинных процессоров на два (у ATI Radeon 9800 XT / ATI Radeon 9800 PRO их было четыре), a NVIDIA и вовсе удвоила: шесть вместо трех у GeForce FX 5950 Ultra и GeForce FX 5900 Ultra. Так или иначе, но на данном этапе конкуренции у крупнейших производителей графических чипов для настольных систем одинаковое число вершинных процессоров. Однако не стоит забывать о том, что количество вершинных процессоров у разных чипов вовсе не обязательно означает одинаковую функциональность ввиду различных подходов в реализации вершинных шейдеров у разных производителей. Если вернуться к нашей таблице спецификаций и просмотреть ее на предмет значений, отвечающих за частоты ядер у обоих решений, то мы можем увидеть, что частота графического ядра у ATI Radeon Х800 XT равняется 520 МГц, в то время как NVIDIA GeForce 6800 Ultra имеет заметно меньшую частоту чипа - 400 МГц. Именно поэтому ATI R420 с тем же числом вершинных процессоров изначально имеет преимущество над NV40 благодаря гораздо более высокой тактовой частоте. Гибкость вершинных процессоров у R420 заметно ниже, чем у NV40, что выражается в отсутствии поддержки динамических переходов в вершинных шейдерах, а также в невозможности производить выборку текстур. Все вместе это означает, что ATI никоим образом не сможет заявить поддержку вершинных шейдеров 3.0, потому что ее чип R420 просто физически не способен их обрабатывать. Количество пиксельных конвейеров - это также одна из ключевых характеристик акселератора, которая влияет на скорость закраски сцены. Здесь мы видим абсолютную солидарность ATI и NVIDIA. Обе компании увеличили количество пиксельных конвейеров ровно в два раза, и теперь как NV40, так и R420 имеют по 16 пиксельных конвейеров, что позволяет выводить им по 16 пикселей за такт. Однако утверждение о том, что R420 имеет 16 пиксельных конвейеров, было бы не совсем верным, так как архитектура работы блока закраски у R420 несколько иная. Если взглянуть на блок-схемы архитектуры нового чипа, мы сможем увидеть, что 16 пиксельных конвейеров (представленных схематично в виде небольших трубочек) сгруппированы в четырех блоках по четыре конвейера. По сути, мы имеем дело не с шестнадцатью, а с четырьмя пиксельными конвейерами, но каждый из этих блоков умеет работать не с одним-единственным пикселем, а сразу с целым блоком пикселей, называемым "квадом", где находятся сразу четыре пикселя в форм-факторе 2x2. Таким образом, мы и получаем 16 выводимых пикселей за такт. Каждый из таких четырех пиксельных квадратов имеет свою независимую организацию работы и свою кэш-память, независимую от других квадов, блоки выборки текстур и сами пиксельные процессоры. По замыслам ATI, такая структура пиксельных конвейеров должна хорошо уменьшить латентность работы блока закраски графического процессора и наиболее оптимальным образом расходовать вычислительные мощности GPU. В результате ATI получает хорошую возможность наиболее эффективно использовать все свои выпускаемые чипы. Путем отключения одного из четырех блоков пиксельных конвейеров можно получать 12, 8 и даже 4 конвейерных решения на базе R420. Такой подход для ATI уже далеко не нов, мы с вами могли убедиться в этом после того, как вышло множество руководств по переделке ATI Radeon 9800 SE в полноценный ATI Radeon 9800 PRO. Канадская компания уже давно использует все свои выпускаемые чипы, и опыт разработки чипов архитектуры R3XX помогает в работе с новыми решениями. Если в ходе тестирования выпущенного чипа обнаруживаются проблемы в одном из блоков, то он благополучно выключается и мы можем использовать три больших оставшихся пиксельных конвейера для производства менее производительных решений. Именно таким образом была получена модификация чипа ATI Radeon Х800 PRO, которая имеет 12 пиксельных конвейеров рендеринга, то есть три блока. Планируемая в скором времени SE-модификация карт ATI Radeon Х800 будет иметь уже только половину пиксельных блоков (два) от ATI Radeon X800 XT. Весьма больным вопросом в свое время был вопрос о точности вычислений при работе с плавающей запятой в пиксельных процессорах. Были и многочисленные скандалы с 3D Mark и нападки на NVIDIA, которая имела гибкую архитектуру своих графических процессоров Ge-Force FX, позволяющих им проводить вычисления как с 16-битной, так и с 32-битной точностью работы с плавающей запятой. Проблемы заключалась в том, что вычисления, проводимые в 16-битном формате, имели на выходе явные артефакты в получаемом изображении (бан-динг), а 32-битные вычисления обходились NVIDIA очень дорого (цена выражалась в FPS). ATI же придерживалась золотой середины в данном вопросе - спецификациями DirectX 9.0 была установлена минимально допустимая точность работы с плавающей запятой - 24 бит. Решив, что изобретать велосипед, а точнее, наступать на грабли NVIDIA, не стоит, ATI в своем новом чипе придерживается старых 24-битных стандартов для вычислений с плавающей запятой, хотя и поддерживает представление данных в 16-битном и 32-битном форматах. И мы можем понять ATI: качество изображения при такой точности работы с плавающей запятой оптимально для среднестатистического глаза. Поддержку шейдеров 3.0 компания вводить не собирается, а это значит, что и поднимать точность работы с плавающей запятой пока рано.

 

GDDR3: новым чипам новую память.

Наверное, наиболее интересной особенностью плат на базе чипа ATI R420 можно считать внедрение памяти стандарта GDDR3. Графические ускорители всегда шагали впереди планеты всей в плане использования новых типов памяти. Сразу вспоминается внедрение DDR и первые платы на ней, DDR - II... Материнские платы с поддержкой памяти DDR - II только-только перешагнули стадию анонсов, а тут уже видеокарты с памятью GDDR3 на подходе. У ATI R420 в плане использования памяти стандарта GDDR3 нет эксклюзивности, потому что NVIDIA также использует данный тип памяти. Тем не менее, есть некоторые особенности в работе контроллера памяти NV40 и R420. ATI для своего решения использует уже достаточно хорошо проверенную схему конфигурирования памяти: вся шина разделена на четыре независимых канала, по 64 бит каждый; 64 х 4 = 256 бит, это и есть результирующая ширина полосы пропускания памяти. Каждый из каналов имеет полностью независимую логику и управляется переключателем, который и отвечает за подачу данных на каждый из четырех каналов. Подобная схема конфигурирования хороша тем, что можно хорошо использовать общий канал памяти. Сама же GDDR3 - это дальнейшее совершенствование стандарта памяти DDR. Мощность графических чипов растет, а вместе с ней растет и потребность в более быстрой шине памяти, и это значит, что должны расти тактовые частоты. Память GDDR3 имеет ряд преимуществ перед GDDR2, так и не получившей должное распространение среди производителей плат. В GDDR3 во многом учтены ошибки GDDR2. Бросаются в глаза цифры поддерживаемых частот (более 600 МГц), применение GDDR3 как единого отраслевого стандарта, а также тесная интеграция нового стандарта памяти с мобильными системами, которые в последнее время начинают стремительно расширять свою функциональность. Вместе с нововведениями GDDR3 сохраняет обратную совместимость с DDR и DDR - II по таким параметрам, как структура данных и импульсы синхронизации. Также память GDDR3 можно смело назвать оверклокерской мечтой (что сама ATI и сделала) из-за низкой потребляемой мощности, что приводит к минимальному нагреву чипов памяти GDDR3 на платах, базирующихся на чипах ATI R420.

 

Технология 3Dc.

Прежде чем мы начнем рассказ о том, что же такое технология 3Dc от ATI и как она работает, необходимо понять, что представляют собой карты нормалей и как они используются. Сегодняшние трехмерные объекты состоят из некоторого числа треугольников, на которые "натянуты" 2D-текстуры. Реалистичные изображения с множеством деталей и неровностей можно получить весьма просто: нужно всего лишь увеличить количество используемых полигонов. Переходы между границами трехмерного объекта станут плавными, мелкие детали выделятся и т.д. Получается дивно: повышай количество полигонов да любуйся на все улучающийся трехмерный объект. Но на самом деле дополнительные полигоны дорого обойдутся при рендеринге графическому процессору, что неминуемо скажется на скоростных показателях рендеринга сцены, иными словами, значение FPS будет явно прихрамывать. Именно для того, чтобы решить вопрос с приданием изображению наилучшего вида с минимально возможными потерями ресурсов графического процессора и памяти, были разработаны различные технологии имитации рельефности, одной из которых карты нормалей, по сути, и являются. Сами карты нормалей - это базы, в которых хранится информация о неровностях трехмерного объекта в виде вектора, который перпендикулярен поверхности объекта в данной точке (так называемый вектор нормали). Что же это дает изображению? Применение карт нормалей вместе с текстурами высокого разрешения дает нам возможность получать хорошо детализированные и качественные трехмерные объекты без увеличения числа полигонов на модели. В картинках с презентации ATI примеры использования карт нормалей для построения различных трехмерных моделей подобраны как нельзя лучше -визуальное отличие от картинок без карт нормалей видно невооруженным взглядом. Модели, использующие карты нормалей, отличаются большей детализацией и наличием множества мелких деталей, которые незаметны на обычных полигональных моделях. Что же требуется от разработчиков, чтобы задействовать эту технологию? Как оказалось, не очень много. Во-первых, создается исходная малополигональная модель трехмерного объекта. Во-вторых, создается высокополигональная модель того же трехмерного объекта. В третьих, рассчитывается разница между первой и второй моделью и на основе полученных данных формируется карта нормалей, которая и сможет затем восстановить первоначальный вид высокополигонального объекта, не проводя его рендеринг, используя лишь малополигональный трехмерный объект. Здесь, естественно, стоит сделать оговорку на то, что сходство между исходной высокополигональной моделью и моделью, использующей карты нормалей, никогда не будет полным. Карты нормалей не содержат геометрической информации, а значит, не могут дать стопроцентно похожий объект на выходе. Полученный при помощи карт нормалей результат - это игра света и тени с человеческим глазом, который вряд ли сможет увидеть различие, но, тем не менее, оно точно будет. Итак, теперь мы разобрались с тем, что же такое карты нормалей, выяснили, что это очень здорово и полезно, но теперь настала очередь ложки дегтя. Да, в описанных выше примерах мы используем малополигональную исходную модель, на которую накладывается карта нормалей, после чего объект приобретает высокую детализацию. Однако, подобно обычным текстурам, карты нормалей должны где-то храниться и, что самое главное, сжиматься, так как в несжатом виде они будут занимать достаточно много места в локальной памяти акселератора, которой немного. Кроме того, в несжатом виде карты нормалей и текстуры давали бы слишком высокую нагрузку на шину памяти, которой необходимо было бы прокачивать через себя слишком большие объемы информации. Для обычных текстур давно уже разработаны специальные методы компрессии - например, DXTC, алгоритмы которого входят в DirectX 9.0. Этими же алгоритмами можно было бы пользоваться и для карт нормалей, однако на практике при сжатии их методами компрессии DXTC карты нормалей теряют часть информации, из-за чего появляются некоторые артефакты и о воссоздании высокополигональной модели речи идти уже не может. Именно для решения проблемы компрессии карт нормалей компанией ATI и была разработана технология 3Dc, которая и позволяет сжимать карты нормалей, тем самым освобождая шину памяти от непомерной нагрузки. Технология в железе реализована в чипе ATI R420, то есть чип сам умеет распаковывать карты нормалей, сжатые алгоритмом 3Dc, что называется, на лету. Как же сие безобразие работает на практике? Мы опустим все математические подробности работы алгоритма 3Dc, которые просто приведут в ужас большинство читателей, не знакомых с векторной алгеброй. Как вам нравится информация, например, про то, что при использовании 3Dc карты нормалей хранят не три, а две компоненты на вектор, а сам вектор принимается за единичный, после чего, как нетрудно догадаться, несложно подсчитать третью компоненту... Коэффициент сжатия при использовании алгоритмов 3Dc составляет 1:4, что весьма и весьма существенно помогает экономить пропускную способность памяти. Для того чтобы карты нормалей были распакованы в шейдерный код, требуется внести всего лишь несколько инструкций, что не должно пагубно сказаться на производительности. Таким образом, со своей прямой задачей - сжатием карт нормалей - новый алгоритм справляется более чем хорошо, остается только надеяться, что его поддержат разработчики игр, тем более что ATI продвигает 3Dc как открытый стандарт, то есть никаких лицензионных отчислений не требует. Сами карты нормалей уже используются девелоперами в следующих проектах: FarCry, Lord of the Ring: Return of the King, Half-Life 2, Doom III, Serious Sam 2. Из них метод компрессии карт нормалей 3Dc поддерживают Serious Sam 2 и Half-Life 2. Неплохо, учитывая, что реализация новой технологии не слишком сложная и не требует от программистов больших умственных или физических усилий. Будем надеяться, что новую технологию не постигнет участь еще одного начинания ATI - TrueForm.

 

Нужны ли нам шейдеры 3.0?

Отчасти мы уже рассматривали данный вопрос в нашем обзоре архитектуры NV40. После копания во внутренностях ATI R420 пора, пожалуй, расставить точки над i и поделиться своими соображениями на сей счет. Ответ, как ни странно, не появился даже с анонсом ATI R420. Как мы уже говорили, ATI на сегодняшний день не может заявить поддержку пиксельных и вершинных шейдеров версии 3.0. Количество исполняемых инструкций шейдера, наличие предикат и количество константных регистров, динамические переходы - все это недоступно, а если и доступно, то в недостаточной степени, чтобы удовлетворить требования спецификаций шейдеров 3.0, которые уже были оглашены Microsoft. Гибкость и возможности программирования на графических процессорах компании NVIDIA всегда были на высоте. Казалось бы, компания разрабатывает свои собственные инструменты программирования для девелоперов, ведет постоянную работу с разработчиками игр, обучая их реализовывать потенциал графических чипов NVIDIA, проводит семинары, форумы, создает собственный язык программирования Cg, наконец! И все это проходит практически мимо игрока - большинство игр (особенно с использованием пиксельных шейдеров 2.0) все равно показывают преимущество карт ATI. Почему так происходит? Причина банальна: программистам лень оптимизировать свой код под архитектуру отдельного чипа, пусть это даже чип NVIDIA. Есть нормативы, разработанные Microsoft, на которые все и равняются. Microsoft HLSL - Microsoft High Level Sha-der Language - язык программирования шейдеров, именно на нем пишется большинство мини-программ, называемых еще шейдерами, и именно в коде, написанном на нем, прекрасно себя чувствуют карты на чипах ATI. К чему же это мы клоним? А к тому, что хотя NVIDIA и имеет всегда на порядок более гибкую и продвинутую архитектуру для программистов, все равно получается, что подавляющему большинству девелоперов это не нужно. Мы боимся, что с тендерами версии 3.0 повторится та же история, что и в свое время с шейдерами 2.0а. На данный момент мы можем констатировать только плавное появление игр с поддержкой пиксельных и вершинных шейдеров 2.0, и даже через три месяца их масса на фоне подавляющего большинства движков игр, которые в лучшем случае, используют шейдеры версии 1.1, будет каплей в море. Шейдеров 1.1 хватает для реализации уже опробованных эффектов вроде красивой водички и прочих нехитрых радостей, которые в свое время приводили просто в дикий восторг владельцев NVIDIA GeForce3. А на остальное у разработчиков нет времени и желания. И вот на фоне только начинающегося внедрения пиксельных шейдеров 2.0 NVIDIA заявляет о поддержке шейдеров третьей версии. Так стоило ли компании спешить, когда API, позволяющий использовать шейдеры 3.0, еще не вышел, а подавляющая масса девелоперов только сейчас осваивает вторую версию пиксельных и вершинных программ? Мы можем сказать, что овчинка стоит выделки только в том случае, если не будет страдать скорость, и вот здесь начинаются подводные камни. Сама NVIDIA предупреждает разработчиков о том, что одно из основных новшеств шейдеров - динамические переходы нужно использовать разумно и осторожно, так как нынешняя архитектура весьма болезненно относится к появлению подобных вещей в коде. Здесь мы можем понять ATI, которой бы понадобилось полностью переработать архитектуру своего R420, являющегося, по сути, наследником R360, конвейеры которого к подобного рода вещам не приспособлены вовсе. Шейдеры 3.0 использовать можно, но с большими оговорками, а значит, это вряд ли кому-то будет нужно. Инертность разработчиков аукнется NVIDIA, а у ATI до снятия этих оговорок будет достаточно времени для того, чтобы основательно подойти к вопросу в своем новом чипе (ревизия R420 с поддержкой шейдеров 3.0?) На наш взгляд, компания поспешила с реализацией шейдеров третьей версии, так как их время все же еще не пришло. Однако кто-то ведь должен двигать прогресс в нужном направлении, верно? Пока нет DirectX 9.0с, равно как и приложений, написанных на пиксельных и вершинных программах версии 3.0, мы не можем прояснить вопросы о скоростных показателях плат NVIDIA на шейдерах 3.0. Посему мы можем только ждать появления API и приложений под него, чтобы посмотреть, что же могут сделать новые пиксельные и вершинные программы, а заодно и оценить скорость работы с ними.

 

Скандалы вокруг ATI.

Все уже давно привыкли журить NVIDIA за всевозможные трюки, оптимизации и заточки. На самом деле все вышеназванное - это следствие организации архитектуры GeForce FX, которая не могла надлежащим образом справляться с новыми задачами, имея при этом на порядок более гибкую архитектуру, чем их прямые конкуренты из ATI. В свете этого было очень необычно услышать что-то подобное про ATI, хотя и канадская компания была в свое время уличена в не совсем благопристойных трюках. Тем не менее, вся прогрессивная общественность была удивлена статьей на немецком сайте Computerbase, которая рассказала об использовании компанией ATI оптимизированной трилинейной фильтрации в их новейших картах на базе чипа R420, а также на базе старичка ATI Radeon 9600. Попробуем же разобраться с тем, что же натворила ATI на сей раз. Прежде чем мы углубимся в рассмотрение хитростей, которые применила ATI в своих новых (и старых) чипах в части реализации трилинейной фильтрации, нужно разъяснить читателям некоторые общие моменты, касающиеся фильтрации текстур у современных ускорителей. Как известно, самый простой и дешевый (с точки зрения производительности) способ фильтрации - это билинейная фильтрация. Она, к сожалению, не учитывает заметные на глаз переходы между границами mip-уровней, что исправляет трилинейная фильтрация, которая усредняет пиксели соседних текстур в области mip-переходов, что дает нам более гладкую картину в этих места. (Пожалуй, все видели во многих современных 3D-играх так называемую лесенку, бегущую перед камерой по гладким поверхностям, это и есть границы переходов между mip-уровнями.) Оптимизации же ATI направлены на снижение вычислительной нагрузки на чип благодаря использованию так называемой билинейной фильтрации, которая обеспечивает схожее качество изображения с трилинейной фильтрацией, но вместе с тем не дотягивает по качеству до полноценной трилинейки из-за того, что границы mip-уровней фильтруемой текстуры, по сравнению с полноценной трилинейкой, немного меньше. Именно этот факт и позволяет получать выигрыш в производительности, однако за счет чуть ухудшившегося качества. Именно подобный тип фильтрации и стала внедрять ATI в своих новых картах серии Х800. Почему же сотни обозревателей по всему миру не заметили ухудшения качества фильтрации? Все достаточно просто, если вспомнить, что для оценки качества всеми тестерами повсеместно используются цветные mip-текстуры, на которых оптимизация не заметна, поскольку при использовании таковых драйвер переключается на использование полноценной трилинейной фильтрации. И оптимизации ATI стали достоянием народа только после того, как совершенно случайно были сняты тесты производительности с цветными mip-уровнями и без таковых и вместо ожидаемой идентичной производительности были получены различные результаты в случае текстур с цветными mip-уровнями мы получили гораздо меньшее количество FPS. Да, качество оптимизированной фильтрации от ATI в реальных игровых приложениях для среднестатистического глаза находится на приличном уровне -здесь мы не можем сильно журить ATI, однако расстраивает другой факт: NVIDIA ввела в свои драйверы опцию, которая помогает либо включать, либо отключать оптимизации фильтраций, в то время как ATI не соизволила никого даже поставить в известность о том, какие методы фильтрации используются в ее новых картах. Мы можем только привести цитату из официального ответа ATI на эту проблему: "Цель трилинейной фильтрации заключается в сглаживании переходов между mip-уровнями. До тех пор, пока эта цель достигается, нельзя говорить о "правильном" или "ошибочном" способе реализации фильтрации". В целом верно, но все равно обидно.

 

Покой нам только снится.

В нашей статье по архитектуре NV40 мы высказали предположение о том, что для NVIDIA в новом витке конкуренции с ATI все могло бы сложиться весьма благополучно, так как все предпосылки для этого имелись. В сегодняшней же статье, а также в нашем недавнем тестировании карты ATI Radeon X800 XT мы смогли убедиться, что ATI также не теряла времени даром и подготовила достойный ответ "русалкам" NVIDIA. Это, впрочем, неудивительно -если на рынке видеоакселераторов де-факто остались только два производителя, продукция которых по своим возможностям удовлетворяет запросам современных геймеров, то вполне логично предположить, что наиболее компетентные в этой области специалисты приблизительно поровну распределились по двум компаниям. А как следствие, скорее всего, критических отставаний в плане совершенства разработок NVIDIA от ATI или ATI от NVIDIA в ближайшее время ожидать не приходится, что хорошо, так как нет ничего лучше для пользователя, чем неспешная (относительно, конечно) и в то же время конструктивная конкурентная борьба! Но данный момент так и не прояснился вопрос с шейдерами 3.0. Если нужная версия DirectX 9.0 увидит свет в ближайшее время и NVIDIA сможет подогреть интерес самих покупателей, а также разработчиков новой шейдерной моделью в реальных игровых, а также синтетических бенчмарках (нам кажется, что теста Pixel Shader 3.0 в грядущем 3DMark 2004 маркетинговый отдел NVIDIA ждет с огромным воодушевлением, больше, чем кто-либо), то мы можем надеяться на то, что третья версия шейдеров пойдет, что называется, в народ. Тогда продукция ATI на чипе R420 немного поблекнет на фоне NV40 и канадской компании в срочном порядке придется искать лекарство в виде нового чипа с поддержкой шейдеров 3.0. А это будет невероятно сложно, учитывая то, что чип R420 не представляет собой нечто новое в архитектурном плане и базируется на технологиях своего предшественника. Однако в запасе у ATI как минимум два козыря: мы ничего не знаем о скорости реализации пиксельных и вершинных шейдеров 3.0 у NVIDIA (вполне возможно, хотя мы и не можем утверждать этого, что скорость шейдеров версии 3.0 окажется на чипе NV40 непростительно низкой, как это было в свое время с шейдерами 2.0 у NV30), а еще канадская компания вполне обоснованно может надеяться на инертность разработчиков программного обеспечения. Практика показывает, что на действительно хорошие проекты уходит время от двух до трех лет. Вспомним хотя бы таких грандов, как Half-Life 2 и Doom III. Буквально две недели назад нас пугали цифрами в 700 условных единиц за решения на базе Х800, однако уже сейчас карты Х800 PRO продаются примерно по 500 долларов, а то и дешевле. Но битва NV40 vs. R420 по всем фронтам пока только начинается. Так что какие-то выводы делать все-таки рано.

Технические характеристики топовых чипов.

 
ATI Radeon X800 XT
NVIDIA GeForse 6800 Ultra
Технологический процесс, мкм
0,13 low-k
0,13 мкм
Число транзисторов, млн. шт.
160
220
Частота работы ядра, МГц 520 400
Тип видеопамяти
256 бит DDR/DDR-II/GDDR3 SDRAM
256 бит DDR/DDR-II/GDDR3 SDRAM
Частота работы памяти, МГц
1120
1100
Пиковая пропускная способность шины видеопамяти, Гб/с
33,4
32,8
Максимальный объем видеопамяти, Мб
512
512
Интерфейс
AGP 3.0 4x/8x
AGP 3.0 4x/8x
Версия шейдеров
2.0
3.0
Типы фильтрации текстур билинейная, трилинейная, анизотропная, трилинейная + анизотропная билинейная, трилинейная, анизотропная, трилинейная + анизотропная
Максимальная степень анизотропной фильтрации
16x
16x
Максимальная степень анизотропной фильтрации
6
6
Число пиксельных конвейеров
16
16
Статические переходы в коде шейдера
да
да
Динамические переходы в коде шейдера
нет
да

 

Графика