Проблемы при регистрации на сайте? НАЖМИТЕ СЮДА!                               Не проходите мимо весьма интересного раздела нашего сайта - проекты посетителей. Там вы всегда найдете свежие новости, анекдоты, прогноз погоды (в ADSL-газете), телепрограмму эфирных и ADSL-TV каналов, самые свежие и интересные новости из мира высоких технологий, самые оригинальные и удивительные картинки из интернета, большой архив журналов за последние годы, аппетитные рецепты в картинках, информативные Интересности из Интернета. Раздел обновляется ежедневно.                               Всегда свежие версии самых лучших бесплатных программ для повседневного использования в разделе Необходимые программы. Там практически все, что требуется для повседневной работы. Начните постепенно отказываться от пиратских версий в пользу более удобных и функциональных бесплатных аналогов.                               Если Вы все еще не пользуетесь нашим чатом, весьма советуем с ним познакомиться. Там Вы найдете много новых друзей. Кроме того, это наиболее быстрый и действенный способ связаться с администраторами проекта.                               Продолжает работать раздел Обновления антивирусов - всегда актуальные бесплатные обновления для Dr Web и NOD.                               Не успели что-то прочитать? Полное содержание бегущей строки можно найти по этой ссылке.                              

Обзор видеоускорителя Nvidia GeForce RTX 3080 Ti: новый лидер, если не брать в расчет GeForce RTX 3090

Оглавление

Особенности архитектуры

Видеокарты семейства GeForce RTX 30 компании Nvidia активно выходили в прошлом году и продолжают в нынешнем. На проходящей в первые дни лета выставке Computex 2021, компания представила новые дополнения в своей линейке видеокарт: GeForce RTX 3080 Ti и GeForce RTX 3070 Ti. С самого начала было понятно, что когда-то могут появиться модели с приставкой Ti (вполне может быть, будут еще и Super) вдобавок к объявленным в самом начале моделям RTX 3080 и RTX 3070. Причем, RTX 3060 Ti появилась через какое-то время даже раньше «обычной» версии RTX 3060, а вот более мощных Ti-моделей нам пришлось ждать аж до нынешнего лета.

Это и неудивительно, ведь особой нужды в них просто не было. Конечно, выпускать новую и улучшенную продукцию любая коммерческая компания должна — чтобы заинтересовывать покупателей. Но зачем это нужно во времена жесточайшего дефицита на GPU и сильно завышенных цен, спросите вы? Майнеры же все равно купят все видеокарты по такой цене, заплатить которую не могут себе позволить обычные игроки. Но и эту проблему (хотя, проблему ли для них?) компания Nvidia пытается решить в том числе и выпуском видеокарты GeForce RTX 3080 Ti.

Читатели помнят, что в модели RTX 3060, вышедшей в феврале этого года, уже была представлена «защита от майнеров», снижающая скорость соответствующих вычислений для используемого алгоритма при майнинге эфира — второй по капитализации криптовалюты, которую чаще всего и майнят на GPU.
Какое-то время та защита даже продержалась, но была обойдена из-за неосторожного выкладывания специальной версии драйвера с отключенной защитой. Впрочем, там тоже были свои сложности, мешающие майнерам (необходимость подключения по PCIe хотя бы x8 и подключенный монитор или его эмулятор), но все это не помогло полностью защититься от их интереса — цены на модель RTX 3060 ровно так же выросли до небес.

И вот, с выпуском на рынок пары новых Ti-моделей, а также перевыпуском почти всех RTX 30 в новой версии LHR, Nvidia делает еще одну попытку (ну или хотя бы ее видимость) вернуть рынок в привычное русло. Улучшенная защита от майнинга сделана при помощи особых идентификаторов оборудования и шифрованного BIOS, защищенного от изменений — можно даже назвать такую защиту аппаратной, хотя основная ее часть выполняется драйверами, но их тоже пока что никто «сломать» не смог.

Получится ли у них, выдержит ли защита? А может быть майнерам и так сойдет, с половинным хэшрейтом? Точно сейчас не скажет никто, но «защищенные от майнеров» модели GPU точно получат пониженный интерес со стороны добытчиков криптовалют, чем был бы к полноценным. Вполне возможно, что это хоть немного повлияет на рынок. Но что больше на него влияет, так это упавшие в последние недели курсы криптовалют, а также заметно сниженная доходность майнинга эфира. Впрочем, пока что она все равно остается на довольно высоком уровне и это не дает сделать выводы о скорой победе над дефицитом и ценами на рынке видеокарт.

Да, ситуация с доходностью майнеров к осени-зиме лишь усугубится. Но так как Nvidia ограничивает только один алгоритм майнинга из существующих, то это может быть недостаточным. К осени-зиме майнеры и так могут перейти на другие криптовалюты, добыча которых никак не ограничена в существующих решениях. Так что ничего еще не решено и ситуация может серьезно поменяться еще не один раз. Посмотрим, что получится в итоге, а пока что продолжим привычный обзор игровой видеокарты GeForce RTX 3080 Ti.

Напомним, что решения Nvidia, основанные на архитектуре Ampere, отличаются от видеокарт архитектуры Turing тем, что они обеспечивают заметно более высокую производительность — благодаря оптимизации и производству по более тонкому техпроцессу, игровые решения новой архитектуры примерно в полтора раза быстрее аналогичных Turing в традиционных задачах растеризации, и до двух раз быстрее при трассировке лучей. Мы уже рассмотрели несколько видеокарт архитектуры Ampere, основанных на разных модификациях чипов GA102 и GA104, и сегодня наше внимание приковано к одному из самых мощных вариантов — модели RTX 3080 Ti, основанной на топовом чипе, имеющем чуть меньшее количество исполнительных блоков, по сравнению с модификацией, используемой в RTX 3090.

GPU поддерживает все технологии компании, и модель RTX 3080 Ti ничем не отличается от RTX 3090 по возможностям. GeForce RTX 3080 Ti выглядит интересным топовым вариантом, явно более выгодным, по сравнению с самой мощной видеокартой. И если цены на новинку не будут слишком завышены, то это — отличный вариант апгрейда для всех обладателей топовых решений, вроде GTX 1080 Ti и RTX 2080 Ti. GeForce RTX 3080 Ti является бескомпромиссным решением, которое позволяет не отказывать в установке максимально возможных настроек и высокого разрешения, включая аппаратную трассировку лучей. Результаты тестов в 4K-разрешении и максимальных настройках на диаграмме показывают, что новинка везде обеспечивает не менее 60 FPS, чем не могут похвастать устаревшие GPU.

Основой рассматриваемой сегодня модели видеокарты является топовый графический процессор архитектуры Ampere, о котором мы уже неоднократно писали. Также, архитектура Ampere имеет достаточно много общего с предыдущими архитектурами Turing и Volta, и перед прочтением материала полезно ознакомиться с нашими предыдущими статьями по теме:

Графический ускоритель GeForce RTX 3080 Ti
Кодовое имя чипа GA102
Технология производства 8 нм (Samsung «8N Nvidia Custom Process»)
Количество транзисторов 28,3 млрд
Площадь ядра 628,4 мм²
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти 384-битная: 12 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6X
Частота графического процессора до 1665 МГц
Вычислительные блоки 80 потоковых мультипроцессоров (из 84 в полном чипе), включающих 10240 CUDA-ядер (из 10496 ядер) для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки 320 тензорных ядер (из 336) для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей 80 RT-ядер (из 84) для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования 320 блоков (из 336) текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 14 широких блоков ROP на 112 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)
Спецификации референсной видеокарты GeForce RTX 3080 Ti
Частота ядра до 1665 МГц
Количество универсальных процессоров 10240
Количество текстурных блоков 320
Количество блоков блендинга 112
Эффективная частота памяти 19 ГГц
Тип памяти GDDR6X
Шина памяти 384-бит
Объем памяти 12 ГБ
Пропускная способность памяти 912 ГБ/с
Вычислительная производительность (FP32) до 34 терафлопс
Теоретическая максимальная скорость закраски 186 гигапикселей/с
Теоретическая скорость выборки текстур 533 гигатекселя/с
Шина PCI Express 4.0
Разъемы по выбору производителя
Энергопотребление до 350 Вт
Дополнительное питание два 8-контактных разъема
Число слотов, занимаемых в системном корпусе 2-3
Рекомендуемая цена $1199 (116 900 рублей)

Имя новой модели соответствует принципу наименования решений компании, когда к промежуточным решениям (между RTX 3080 и RTX 3090, в данном случае) добавляются суффиксы Ti. Между указанными моделями она как раз и занимает свое положение в линейке. Рекомендованная цена GeForce RTX 3080 Ti составляет $1199, или 116 900 рублей, что также где-то между ценами на две соседние видеокарты, не имеющие суффиксов в названии.

Впрочем, в нынешней ситуации эти цифры не имеют ничего общего с реальностью, к сожалению. Все понимают, что рекомендованные цены на видеокарты сейчас не имеют никакого отношения к ценам реальным, ну разве что относительное. Ну не может Nvidia выставить на RTX 3080 Ti цену, близкую к реальной розничной. Тогда им пришлось бы менять цены всей линейки, и на фоне столь же виртуальных рекомендованных цен конкурента, привлекательность GeForce бы снизилась. Так что все продолжают учитывать два уровня цен — официальный, далекий от реальности, и спекулятивный, вызванный дисбалансом в уровнях спроса и предложения. А спекулятивную цену на нашем рынке можно ожидать порядка 200 тысяч рублей, и то не в начале продаж, скорее всего.

Условным конкурентом со стороны соперничающей компании AMD, для RTX 3080 Ti является Radeon RX 6900 XT, для которой установлена меньшая рекомендованная цена в $999, да и продаются видеокарты AMD несколько дешевле аналогичных решений Nvidia — по причине того, что они обеспечивают меньшую производительность при майнинге. Так что конкуренция между RX 6900 XT и RTX 3080 Ti будет очень условной. Можно отметить, что для игровых применений у Ampere есть преимущество в виде более эффективной аппаратной трассировки лучей и поддержки технологии увеличения производительности DLSS.

Зато у решений AMD больше видеопамяти — 16 ГБ против 12 ГБ, хотя в играх в обозримом будущем это вряд ли как-то скажется. В отличие от профессионального применения для создания цифрового контента, в которых каждый гигабайт на счету. Но у Nvidia там есть более мощная RTX 3090 с 24 ГБ памяти, лучше подходящая для профессиональных задач. Ну а 12 ГБ в случае RTX 3080 Ti можно считать оптимальным объемом видеопамяти, с учетом ширины шины.

Интересно, что уровень потребления энергии у RTX 3080 Ti оставили на уровне старшего решения RTX 3090 — 350 Вт. С одной стороны, это понятно, так как GPU в них используется одинаковый, а разница в количестве активных блоков не так велика. С другой — рабочая частота чипа и видеопамяти у RTX 3080 Ti несколько ниже, да и имеющийся объем видеопамяти вдвое меньше, а ведь чипы GDDR6X потребляют немало энергии. Возможно, так сделано, чтобы не слишком сильно «душить» новую модель.

Особого смысла рассматривать GeForce RTX 3080 Ti в исполнении самой Nvidia нет, ведь такие карты не будут массово продаваться. Зато партнеры компании, производящие видеокарты, уже анонсировали и выпустили множество решений собственного дизайна, включая разогнанные варианты и/или имеющие довольно массивную систему охлаждения с тремя вентиляторами, что куда лучше подходит для столь горячего решения, чем двухслотовый корпус от модели RTX 3080 FE, применяемый в референсной видеокарте RTX 3080 Ti, доставшейся нам на тесты.

Будем надеяться, что видеокарты модели RTX 3080 Ti вскоре появятся в продаже по вменяемым ценам. В идеале — близким к рекомендованной, хотя это вряд ли, особенно поначалу. Явно недостаточные объемы производства чипов, огромный спрос на новые видеокарты со стороны и геймеров и майнеров привел к дефициту видеокарт семейства GeForce RTX 30, что выражается в 2-3 раза завышенных розничных ценах. И пока что коренных изменений на рынке ждать не приходится, как бы их ни хотелось.

Архитектурные особенности

Топовый графический процессор GA102, используемый в GeForce RTX 3080 Ti, уже известен нам по модели RTX 3090, просто он был урезан еще чуть сильнее. Как и все графические процессоры компании Nvidia, чип состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации Raster Operator (ROP) и контроллеры памяти.

Полный чип GA102, содержит семь кластеров GPC и 84 мультипроцессора SM — по 12 штук на каждый кластер. Каждый GPC содержит по шесть кластеров TPC, состоящих из пары мультипроцессоров SM, пары RT-ядер и одного движка PolyMorph Engine для работы с геометрией. И всего полная версия графического процессора GA102 содержит 10752 потоковых CUDA-ядра, 84 RT-ядра второго поколения и 336 тензорных ядер третьего поколения.

Модель GeForce RTX 3080 Ti использует слегка урезанный по количеству блоков вариант чипа. Эта модификация получила 80 активных блоков SM — то есть, пара кластеров TPC и четыре мультипроцессора SM в нем отключены. Соответственно, отличается и количество остальных блоков, и такой GPU в итоге имеет 10240 CUDA-ядер, 320 тензорных ядер и 80 RT-ядер. Текстурных блоков в этой модификации 320 штук, а вот количество блоков ROP осталось неизменным — 112. То есть, разница с RTX 3090 совсем невелика — в версиях чипов отключены один и два мультипроцессора, соответственно.

Подсистема памяти в этой модификации чипа включает нетронутые двенадцать 32-битных контроллеров памяти, что дает нам 384-бит в общем. Каждый 32-битный контроллер связан с разделом кэш-памяти второго уровня объемом в 512 КБ, так что общий объем L2-кэша получается равным 6 МБ. GeForce RTX 3080 Ti использует 12 ГБ новой GDDR6X-памяти, которая подключена по полной 384-битной шине при рабочей частоте в 9,5(19) ГГц, что дало 912 ГБ/с пропускной способности, что также лишь чуть ниже, чем у топовой RTX 3090.

А вот объем видеопамяти пришлось урезать. На 384-битную шину можно поставить 6, 12 или 24 ГБ, и последний вариант уже занят топовой картой, так что выбора не осталось, пришлось ставить 12 ГБ. Это больше, чем у RTX 3080, но меньше, чем у конкурента, хотя вряд ли это может вызвать какие-то проблемы для RTX 3080 Ti. Ведь даже в 4K-разрешении при максимальных настройках игры до сих пор реально не требуют большего объема памяти, чем 8 ГБ. Хотя некоторые проекты и могут занимать всю имеющуюся видеопамять, занимая ее своими ресурсами, но производительность видеокарт с меньшим объемом видеопамяти при этом не страдает.

Рассматривать в очередной раз все архитектурные улучшения Ampere мы не будем, все уже было написано в теоретическом материале по GeForce RTX 3080. Основным нововведением Ampere является удвоение FP32-производительности для каждого мультипроцессора SM, по сравнению с семейством Turing, что привело к значительному повышению пиковой производительности. Почти то же самое касается и RT-ядер — хотя их число и не изменилось, внутренние улучшения привели к удвоению темпа поиска пересечений лучей с геометрией. Улучшенные тензорные ядра хоть и не увеличили производительность при обычных условиях, но темп таких вычислений удвоился, а также появилась возможность удвоения скорости обработки так называемых разреженных матриц.

Добавим немного информации о поддержке стандарта вывода изображения HDMI 2.1 и аппаратного декодирования видеоданных в формате AV1. Они поддерживаются всей серией GeForce RTX 30, включая RTX 3080 Ti, естественно. Разъемы стандарта HDMI 2.1 позволяют подключить устройства с 4K-разрешением и частотой обновления в 120 Гц или 8K с 60 Гц, а аппаратный декодер AV1 обеспечивает просмотр онлайн-видео в лучшем качестве, по сравнению с известными форматами, вроде H.264, HEVC и VP9.

Напоследок давайте кратко сравним некоторые теоретические показатели производительности GeForce RTX 3080 Ti и RTX 2080 Ti — это даст нам понимание того, насколько быстрее стало решение нового семейства по сравнению с аналогичной по позиционированию картой из предыдущего поколения.

Если сравнивать указанные две модели по теоретическим показателям, то новое решение имеет 10240 активных CUDA-ядер, что более чем вдвое больше, чем у GeForce RTX 2080 Ti, поэтому новая модель обеспечивает соответствующий прирост в скорости вычислений, давая до 34 терафлопс шейдерной производительности, 67 терафлопс от RT-ядер и до 273 тензорных терафлопс (с учетом разреженности матриц) вычислительной мощи. Совершенно неудивительно, что GeForce RTX 3080 Ti в играх и других приложениях оказалась значительно быстрее, чем GeForce RTX 2080 Ti:

Модель видеокарты GeForce RTX 3080 Ti является флагманской, и она в среднем в полтора раза быстрее аналогичной по позиционированию RTX 2080 Ti из предыдущего семейства в играх при 4K-разрешении. Новая модель предназначена для энтузиастов, желающих играть во все современные игры в самых высоких разрешениях и настройках качества, без каких-либо компромиссов. Предыдущие аналогичные модели GTX 1080 Ti и RTX 2080 Ti были именно такими, и компания выпустила для них отличную замену.

А по сравнению с GTX 1080 Ti, которая и сегодня остается очень мощной видеокартой, новинка RTX 3080 Ti дает вдвое более высокую производительность при традиционной растеризации, и много быстрее ее при трассировке лучей, которая еще и не всегда поддерживается играми в случае GTX 1080 Ti. Это довольно большой шаг в скорости и качестве рендеринга. А если вспомнить технологию улучшения производительности DLSS, которая также поддерживается новинкой, то ее отрывы от GTX 1080 Ti могут быть еще больше.

Но насколько сильно RTX 3080 Ti отстанет от флагманской RTX 3090? Мы рассмотрим это далее на практике, но по основным показателям, таким как производительность математических вычислений, скорость текстурных выборок и пропускная способность памяти, новое решение на GA102 отстает от старшей модели совсем немного, буквально на считанные проценты — порядка 3%-6%. Мы обязательно проверим, как покажет себя новинка в синтетических и игровых тестах, но полагаем, что скорость рендеринга будет отличаться незначительно, что делает новинку весьма привлекательной.

Как и другие решения линейки, модель GeForce RTX 3080 Ti поддерживает все полезные технологии Nvidia, такие как RTX, DLSS, Reflex и Broadcast. Nvidia продолжает работу по внедрению своих технологий в игры, на выставке Computex 2021 было объявлено о добавлении технологий DLSS, Reflex и RTX в несколько игр. Например, технология снижения задержек при игре Reflex будет внедрена в War Thunder и Escape from Tarkov, DLSS появится в Red Dead Redemption 2, а трассировка лучей RTX — в Doom Eternal.

На данный момент уже более 60 игр с поддержкой технологий Nvidia включают применение трассировки лучей и/или технологии DLSS, и в их число входят самые популярные игры, как сетевые, так и однопользовательские. А еще порядка 16 игр с поддержкой технологий RTX уже были анонсированы и находятся в разработке. Скорее всего, их количество будет расти постоянными темпами и уже не обязательно с помощью Nvidia. Аппаратное ускорение трассировки лучей завоевало популярность в том числе и на новых игровых консолях, поэтому количество мультиплатформенных игр с трассировкой будет постоянно увеличиваться.

Профессиональное применение

Важно помнить, что видеокарты GeForce RTX 30 используются далеко не только в играх и майнинге, но и при создании различного контента. Даже многие современные игроки не просто играют, а делятся своим игровым процессом с друзьями и сообществом, транслируя видеопоток или записывая и монтируя процесс своей игры для создания роликов по играм. И современные GPU могут им помочь в этом процессе, ускоряя кодирование и редактирование видеоданных, а также применение некоторых эффектов.

Если совсем не касаться игр, то не секрет, что большое количество профессионалов использует GPU для ускорения своих задач при редактировании видео и фото, при создании 3D-анимации, рендеринге в реальном времени в таких средах, как Nvidia Omniverse или Unreal Engine. И GeForce RTX 3080 Ti отлично подходит для таких задач, так как она имеет 12 ГБ быстрой GDDR6X-памяти на борту, что на 20% больше, чем у RTX 3080 — это дает возможность увеличить разрешение текстур, сложность 3D-сцен и т.д. Больший объем видеопамяти позволяет работать с большим массивом данных одновременно, и объем VRAM очень важен для профессиональных применений.

Также новый GPU до двух раз быстрее RTX 2080 Ti в трассировке лучей, а сочетание работы RT-ядер и тензорных ядер обеспечивает еще большее качество картинки при помощи эффективного шумоподавления Optix AI Denoising, использующего искусственный интеллект. Такой шумодав поддерживается в приложениях: Autodesk Arnold, REDSHIFT, Chaos V-ray, OTOY OctaneRender и Blender Cycles. Все это позволяет получить на RTX 3080 Ti очень быстрый рендеринг сцен при предпросмотре и в рабочей среде 3D-приложений, что увеличивает удобство работы и ускоряет весь процесс.

А еще именно в семействе RTX 30 появилась поддержка аппаратного ускорения смазывания в движении (Motion Blur), которое очень часто используется в 3D-рендеринге. RT-ядра второго поколения умеют ускорять этот процесс в несколько раз, по сравнению с предыдущими поколениями GPU. Также начинает появляться и поддержка технологии DLSS в профессиональном ПО. Так, D5 Render стал первым подобным приложением, предназначенным для архитектурных визуализаций.

Возможности искусственного интеллекта также используются и в некоторых инструментах таких популярных пакетов, как DaVinci Resolve, Adobe Premiere Pro и Photoshop. Самые популярные пакеты для редактирования видео поддерживают возможности GPU при помощи использования CUDA-ядер для вычислений, что в некоторых случаях значительно ускоряет процесс цветокоррекции и таких фильтров, как смазывание и повышение резкости, а также некоторых других фильтров. Все это также снижает время на обработку данных.

В общем, модель GeForce RTX 3080 Ti отлично подходит для профессионалов в сфере создания контента, которых становится все больше и больше. Новая модель отличается поддержкой самых современных технологий, высочайшей производительностью и наличием 12 ГБ очень быстрой памяти. Все это поможет создателям контента сократить время работы над их проектами и улучшить итоговое качество картинки.

Для профессионалов Nvidia выпустила платформу Studio, с отдельными оптимизированными драйверами, пакетами SDK и внедрила поддержку в самые популярные приложения, вроде Adobe Photoshop, Blender, DaVinci Resolve и другие. Кроме этого, для максимального удобства пользователей, поддержка приложений для создания контента появилась и в GeForce Experience, который позволяет оптимизировать настройки драйверов точно так же легко, как это делается при оптимизации игровых настроек.

Вся серия GeForce RTX 30 обеспечивает более высокую скорость рендеринга и возможности искусственного интеллекта в профессиональных приложениях, а RTX 3080 Ti обеспечивает производительность, близкую к скорости RTX 3090, что будет очень полезно для многих пользователей из-за меньшей цены новинки. Мы планируем сделать отдельное исследование по производительности и возможностям новых GPU в профессиональном ПО, а пока что переходим к описанию особенностей референсного варианта GeForce RTX 3080 Ti.

Особенности видеокарты Nvidia GeForce RTX 3080 Ti Founders Edition

Сведения о производителе: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США. Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — GeForce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) — около 5000 человек.

Объект исследования: ускоритель трехмерной графики (видеокарта) Nvidia GeForce RTX 3080 Ti Founders Edition 12 ГБ 384-битной GDDR6X

Nvidia GeForce RTX 3080 Ti Founders Edition 12 ГБ 384-битной GDDR6X
Параметр Номинальное значение (референс)
GPU GeForce RTX 3080 Ti (GA102)
Интерфейс PCI Express x16 4.0
Частота работы GPU (ROPs), МГц 1665(Boost)—1995(Max)
Частота работы памяти (физическая (эффективная)), МГц 4750 (19000)
Ширина шины обмена с памятью, бит 384
Число вычислительных блоков в GPU 80
Число операций (ALU/CUDA) в блоке 128
Суммарное количество блоков ALU/CUDA 10240
Число блоков текстурирования (BLF/TLF/ANIS) 320
Число блоков растеризации (ROP) 112
Число блоков Ray Tracing 80
Число тензорных блоков 320
Размеры, мм 285×100×37
Количество слотов в системном блоке, занимаемые видеокартой 2
Цвет текстолита черный
Энергопотребление пиковое в 3D, Вт 361
Энергопотребление в режиме 2D, Вт 35
Энергопотребление в режиме «сна», Вт 11
Уровень шума в 3D (максимальная нагрузка), дБА 41,0
Уровень шума в 2D (просмотр видео), дБА 18,0
Уровень шума в 2D (в простое), дБА 18,0
Видеовыходы 1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работы нет
Максимальное количество приемников/мониторов для одновременного вывода изображения 4
Питание: 8-контактные разъемы 1 (12-контактный)
Питание: 6-контактные разъемы 0
Максимальное разрешение/частота, Display Port 3840×2160@120 Гц (7680×4320@60 Гц)
Максимальное разрешение/частота, HDMI 7680×4320@60 Гц
Максимальное разрешение/частота, Dual-Link DVI 2560×1600@60 Гц (1920×1200@120 Гц)
Максимальное разрешение/частота, Single-Link DVI 1920×1200@60 Гц (1280×1024@85 Гц)
Стоимость на момент подготовки обзора рекомендованная — от 116 900 рублей, предполагаемая реальная стоимость — 200 000 рублей или выше

Память

Карта имеет 12 ГБ памяти GDDR6X SDRAM, размещенной в 12 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6X, MT61K256M32JE-19) рассчитаны на номинальную частоту работы в 5500 (21000) МГц. Расшифровщик кодов на упаковках FBGA находится здесь.

Особенности карты и сравнение с Nvidia RTX 3080 Founders Edition (10 ГБ)

Nvidia GeForce RTX 3080 Ti Founders Edition (12 ГБ) Nvidia GeForce RTX 3080 Founders Edition (10 ГБ)
вид спереди
вид сзади

Я уже отмечал, что для своих собственных карт инженеры Nvidia сделали дизайн не только уникальным, но и весьма забавным внешне. Хорошо видно, 3080 Ti в референс-исполнении отличается от уже более младшего собрата 3080 полной комплектацией микросхемами памяти (12 ГБ и 384 бит против 10 и 320, соответственно, у RTX 3080), а схема питания особых изменений не претерпела.

Суммарное количество фаз питания у GeForce RTX 3080 Founders Edition — 18. Это на 2 больше, чем у GeForce RTX 2080 Ti (там 16), и на 2 меньше, чем у GeForce RTX 3090 (там 20). При этом распределение фаз у GeForce RTX 2080 Ti — 13 фаз на ядро и 3 на микросхемы памяти, у GeForce RTX 3080 — 15+3. У RTX 3080 Ti Founders Edition тоже 15 фаз на ядро и 3 — на память, просто одна фаза питания ядра перекочевала с правой стороны PCB на левую.

Зеленым цветом отмечена схема питания ядра, красным — памяти. При этом удвоителей (даблеров) фаз нет, для управления схемой питания GPU используются три ШИМ-контроллера Monolithic Power Systems: MP2884 рассчитан на 4 фазы, MP2886 — на 6 фаз, а MP2888 — на управление 10 фазами питания. Первые два расположены на оборотной стороне платы, а третий — на лицевой.

Совместными усилиями они обеспечивают 15 фаз схемы питания GPU. Система питания микросхем памяти включает 3 фазы, которыми заведует один из uS5650Q (uPI Semiconductor).

Второй такой контроллер отвечает за мониторинг состояния платы.

В преобразователе питания, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае, MP86957 той же Monolithic Power Systems.

Стоит отметить особую ревизию процессора GA102 — 225-A1, когда как у RTX 3080 был — 200-KD-A1, а у RTX 3090 — 300-A1. Как известно, нам было обещано, что именно в этом кристалле уже появилась аппаратная защита от майнинга по алгоритму ethash. Но при этом мы видим дату выпуска — 36я неделя 2020го года. То есть данный чип под 3080 Ti был выпущен еще осенью, когда вообще речь о защитах от майнинга не заходила. Мы видим, что все же защита от майнинга реализована не через внесение изменений в сам чип, а через использование особых ID и неизменяемого BIOS, то есть аппаратно, но на самих платах, а не внутри GPU.

У карты 12-контактный коннектор питания собственного изобретения. Причем один.

Ряд производителей блоков питания, прежде всего Seasonic, объявили о выпуске отдельных кабелей («хвостов») для своих модульных БП для подключения к референс-картам серии GeForce RTX 30 (мы уже писали многократно об этом).

Ну а с самой картой, конечно же, поставляется переходник, позволяющий подключить два 8-контактных коннектора к новому разъему.

Возникает вопрос: зачем эти сложности?. Ответ на этот вопрос очевиден: из-за нового дизайна FE традиционные два 8-контактных разъема сюда не вписались бы.

Что касается возможности разгона, то из-за уже чрезмерной нагрузки по энергопотреблению и нагреву на такой относительно небольшой корпус видеокарты мы не стали изучать разгон, к тому же в продаже 3080 Ti FE если и появится, то в сказочно штучных количествах, поэтому разгон будем изучать уже на примерах серийных карт партнеров Nvidia.

Нагрев и охлаждение

Мы уже писали, что в Nvidia решили кардинально переделать референс-дизайн, сделать PCB более компактной, и что для новых карт задумана специальная система охлаждения.

Основной пластинчатый радиатор, выполненный из медного сплава и очень тяжелый, имеет тепловые трубки, подведенные к теплосъемнику на GPU. Массивная основа (по сути, настоящая рама) охлаждает также микросхемы памяти с лицевой стороны и преобразователи питания VRM. Задняя пластина участвует в охлаждении мосфетов схемы питания микросхем памяти и оборотной стороны печатной платы в области мосфетов схемы питания GPU.

Вентиляторов здесь два (∅90 мм), в обоих используются двойные подшипники. Особенность СО состоит в том, что вентиляторы установлены с разных стороны карты: один с лицевой, другой с оборотной.

Как видно по схеме, правый вентилятор продувает радиатор (ту его часть, куда выведены тепловые трубки) насквозь (через решетку на оборотной стороне). Нагретый воздух поднимается вверх (при типичном расположении видеокарты в корпусе), и его должен подхватить вытяжной вентилятор в корпусе системного блока. Левый же вентилятор сразу выдувает горячий воздух за пределы корпуса сквозь отверстия в брекете карты. PCB имеет характерный вырез именно для эффективной работы правого вентилятора. Для эффективной работы такого кулера должна быть организована хорошая вентиляция, потому что часть нагретого воздуха будет оставаться в корпусе.

Напомним, что обычно видеокарты останавливают свои вентиляторы в простое, при работе в 2D, если температура GPU опускается ниже примерно 60 градусов, и СО при этом становится бесшумной. В случае карты Nvidia GeForce RTX 3080 Ti Founders Edition режим работы кулера иной: для остановки вентиляторов температура GPU должна быть ниже 50 °C, температура чипов памяти — ниже 80 °C, а энергопотребление самого GPU — ниже 35 Вт. Только при соблюдении всех трех условий вентиляторы остановятся. Как правило, в режиме простоя эти условия соблюдаются.

Мониторинг температурного режима с помощью утилиты MSI Afterburner:

После 2-часового прогона под нагрузкой максимальная температура ядра не превысила 80 градусов, что является как минимум нормальным результатом для видеокарт топового уровня. Нагрев измерялся в условиях работы в просторном, но закрытом корпусе с фронтальными нагнетающими вентиляторами и задним вытяжным.

Максимальный нагрев наблюдался в центральной части PCB, в основном около ядра (и основным источником нагрева является память: она может нагреваться выше 100 градусов даже просто под нагрузкой в 3D в играх).

Максимальное энергопотребление было зафиксировано на уровне 361 Вт.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

  • менее 20 дБА: условно бесшумно
  • от 20 до 25 дБА: очень тихо
  • от 25 до 30 дБА: тихо
  • от 30 до 35 дБА: отчетливо слышно
  • от 35 до 40 дБА: громко, но терпимо
  • выше 40 дБА: очень громко

В режиме простоя в 2D температура была не выше 42 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось, поэтому шум сохранялся на прежнем уровне.

В режиме максимальной нагрузки в 3D температура достигала 80 °C. Вентиляторы при этом раскручивались до 2320 оборотов в минуту, шум вырастал до 41 дБА: это очень громко.

Впрочем, вся эта часть исследования не очень интересна, так как в продаже референс-карт будет крайне мало.

Подсветка

Подсветка у карты белого цвета и реализована на верхнем торце СО в виде логотипа и в изогнутых линиях вдоль направляющих в центре СО.

Подсветка не регулируется — только фирменной утилитой Asus Armoury Crate, поэтому если у вас есть материнская плата этого производителя, будет возможность синхронизировать подсветку RTX 3080 Ti FE с остальной подсветкой).

Комплект поставки и упаковка

Комплект поставки, кроме традиционного руководства пользователя, включает переходник питания на новый 12-контактный разъем с двух 8-контактных коннекторов.

Упаковка очень стильная и вызывает ощущение премиального продукта.

Тестирование: синтетические тесты

Конфигурация тестового стенда

  • Компьютер на базе процессора AMD Ryzen 9 5950X (Socket AM4):
    • процессор AMD Ryzen 9 5950X (разгон до 4,6 ГГц по всем ядрам);
    • ЖСО Cougar Helor 240;
    • системная плата Asus ROG Crosshair Dark Hero на чипсете AMD X570;
    • оперативная память TeamGroup T-Force Xtreem ARGB (TF10D48G4000HC18JBK) 32 ГБ (4×8) DDR4 (4000 МГц);
    • SSD Intel 760p NVMe 1 ТБ PCI-E;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
    • блок питания Seasonic Prime 1300 W Platinum (1300 Вт);
    • корпус Thermaltake Level20 XT;
  • операционная система Windows 10 Pro 64-битная; DirectX 12 (v.20H2);
  • телевизор LG 55Nano956 (55″ 8K HDR, HDMI 2.1);
  • драйверы AMD версии 21.5.1;
  • драйверы Nvidia версии 466.27/54;
  • VSync отключен.

Набор синтетических тестов продолжает постоянно меняться, добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Мы полностью отказались от ранее активно использовавшихся нами тестов RightMark3D, так как они устарели слишком сильно, и на столь мощных GPU или не запускаются вообще, или упираются в различные ограничители, не загружая работой блоки графического процессора и не показывая его истинную производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы пока что оставили в полном составе, так как заменить их попросту нечем, хотя и они уже изрядно устарели.

Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), хотя и они тоже постепенно изживают себя, а также несколько разнообразных тестов для измерения производительности трассировки лучей, программной и аппаратной. В качестве полусинтетических тестов у нас также используется и несколько подтестов из популярного пакета 3DMark, включая Time Spy и другие.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce RTX 3080 Ti со стандартными параметрами (RTX 3080 Ti)
  • GeForce RTX 3090 со стандартными параметрами (RTX 3090)
  • GeForce RTX 3080 со стандартными параметрами (RTX 3080)
  • GeForce RTX 2080 Ti со стандартными параметрами (RTX 2080 Ti)
  • Radeon RX 6900 XT со стандартными параметрами (RX 6900 XT)
  • Radeon RX 6800 XT со стандартными параметрами (RX 6800 XT)

Для анализа производительности новой видеокарты GeForce RTX 3080 Ti мы выбрали несколько видеокарт компании Nvidia из двух последних поколений. С подбором проблем не возникло, для сравнения с прошлым поколением мы взяли модель RTX 2080 Ti аналогичного позиционирования, а из текущего поколения — результаты современных моделей RTX 3080 и RTX 3090, которые находятся в современной линейке ниже и выше новинки — будет интересно посмотреть, насколько медленнее или быстрее новая модель относительно них.

С соперниками из стана AMD в этот раз все тоже оказалось просто. Единственным условным конкурентом для GeForce RTX 3080 Ti является Radeon RX 6900 XT с несколько меньшей розничной ценой, его мы и взяли в набор. Ну и также добавили и Radeon RX 6800 XT в качестве поддержки, просто чтобы ему одному не было скучно. Потому что по цене к новинке Nvidia близок только наиболее производительный графический процессор архитектуры RDNA второго поколения, а все остальные заметно дешевле сегодняшней новинки.

Тесты из 3DMark Vantage

Мы традиционно рассматриваем устаревшие синтетические тесты из пакета 3DMark Vantage, ведь в них зачастую можно найти что-то интересное, чего нет в других, более современных тестах. Feature тесты из этого тестового пакета имеют поддержку DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новых видеокарт мы всегда делаем какие-то полезные выводы.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя иногда они все же получаются несколько заниженными для некоторых GPU. Слегка урезанная версия GA102 в исполнении RTX 3080 Ti имеет сравнительно большое количество текстурных модулей, поэтому не слишком сильно уступает старшей модели. Что касается сравнения с RTX 3080, то приличный отрыв от нее вполне объясним.

Сравнение новинки с условными конкурентами компании AMD не приносит новых выводов, мы уже видели это по RTX 3090 и RX 6900 XT. Скорость текстурирования у нового семейства Radeon из-за большого количества текстурных блоков весьма высока, с количеством TMU в архитектуре RDNA 2 все отлично. Radeon обычно имеют большее количество блоков текстурирования и с такими задачами почти всегда справляются лучше видеокарт конкурента с аналогичным ценовым позиционированием. Новинка Nvidia не догнала даже RX 6800 XT.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.

Цифры из второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP, но в этом случае разница между RTX 3080 Ti и RTX 3090 получилась несколько больше ожидаемой. Хотя блоков ROP в этих модификациях GA102 одинаковое количество, RTX 3080 Ti оказалась заметно медленнее в этом тесте. А вот модели Radeon имеют отличные показатели — они обогнали все представленные GeForce.

Видеокарты компании Nvidia по пиковой скорости заполнения сцены почти всегда были не так хороши, и GeForce RTX 3080 Ti уступает обеим Radeon. Если сравнивать с менее мощной моделью GPU того же производителя, то новая модель быстрее, конечно, но по теории она должна быть еще ближе к RTX 3090.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно полезный тест, так как результаты в нем часто неплохо коррелируют с тем, что получается в игровых тестах.

Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель GeForce RTX 3080 Ti показала ожидаемый результат почти на уровне RTX 3090, уступив ей совсем немного, примерно сколько и должна по теории. Что касается RTX 3080 без суффикса, то новинка заметно быстрее, что также соответствует теории. Если сравнивать RTX 3080 Ti с Radeon, то графические процессоры AMD в этом тесте всегда были сильны, и неудивительно, что RX 6900 XT оказалась быстрее, хотя RX 6800 XT где-то на том же уровне, но она и сильно дешевле.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы давно уже получаем явно некорректные результаты в этом тесте, поэтому учитывать результаты всех видеокарт GeForce тут просто нет смысла, они просто неверны. И модель RTX 3080 Ti ничего не изменила, так как дело в драйверах, которые одинаковы для всех GPU. Никто уже не оптимизирует их для столь древнего тестового пакета.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты, но они хотя бы чуть ближе к истине, чем в прошлом подтесте этого же бенчмарка. Представленные видеокарты Nvidia и в этот раз необъяснимо медленны, и явными лидерами тут являются видеокарты Radeon, особенно семейства RX 6000. Рассматриваемая сегодня RTX 3080 Ti уступила старшей сестре на основе архитектуры Ampere необъяснимо много и оказалась на уровне RTX 3080, что не соответствует любой теории. Впрочем, результаты решений Nvidia некорректны в любом случае.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но она обычно близка к пиковой производительности видеочипов в предельных задачах. В тесте используются операции с плавающей запятой, и новая архитектура Ampere должна бы раскрыть свои уникальные возможности, но тест слишком устарел и не показывает современные GPU с лучшей стороны. Свежие решения компании AMD на основе архитектуры RDNA 2 в этом тесте не блещут, хотя RX 6900 XT почти достала новую RTX 3080 Ti. Которая проигрывает более старшей модели RTX 3090 совсем чуть-чуть — примерно так, как и должна по теории. Далее мы рассмотрим более современные тесты, использующие повышенную нагрузку на GPU.

Тесты Direct3D 11

Переходим к Direct3D11-тестам из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64 000 штук.

В первом Direct3D11-тесте новая GeForce RTX 3080 Ti почти не отстала от RTX 3090, что вполне нормально, а вот RTX 3080 от них отстала. Интересно, что Radeon RX 6900 XT выступила отлично, немного опередив все карты Nvidia. Правда, по опыту предыдущих тестов мы знаем, что GeForce в этом тесте выступают не очень хорошо. Да и, судя по крайне высокой частоте кадров, вычисления в этом примере из SDK уже слишком просты для мощных видеокарт, и лучше рассматривать другие тесты.

Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.

Производительность рендеринга в этом тесте больше всего зависит от оптимизации драйвера и командного процессора GPU. С ними дела неплохо обстоят у решений Nvidia, но видеокарты семейств RDNA 1 и 2 заметно улучшили позиции конкурирующей компании, особенно мощнейшая Radeon RX 6900 XT, ставшая лидером. Если рассматривать RTX 3080 Ti по сравнению с топовым решением Ampere, то отставание кажется великоватым. Похоже, что и эти тесты не слишком показательны и скоро мы с ними расстанемся.

Третий D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно любопытный. При тестировании мы использовали настройки по умолчанию.

Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. Новая видеокарта GeForce RTX 3080 Ti показала ожидаемый результат близко к показателям соседних по линейке RTX 3080 и RTX 3090. Единственная карта Radeon, представленная в нашем сравнении, оказалась далеко позади. Хотя и в этом тесте частота кадров излишне высока — очередная задача является слишком простой, особенно для топовых современных GPU.

Тесты Direct3D 12

Переходим к примерам из DirectX SDK компании Microsoft — все они используют последнюю версию графического API — Direct3D12. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу.

Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графических процессоров семейства Ampere. Для увеличения нагрузки на GPU мы модифицировали пример, увеличив число моделей в кадре относительно оригинальных настроек в 100 раз.

Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и эффективности работы мультипроцессоров GPU в целочисленных вычислениях. Решения Nvidia лучше справляются с такими операциями, и новая GeForce RTX 3080 Ti почти не отстала от RTX 3090, также к ним очень близка и RTX 3080, что довольно странно. Ну а единственная видеокарта Radeon модели RX 6900 XT оказалась хуже всех GeForce — вероятнее всего, дело в недостатке программной оптимизации в драйверах.

Очередной пример из Direct3D12 SDK — Execute Indirect Sample, он создает большое количество вызовов отрисовки при помощи ExecuteIndirect API, с возможностью модификации параметров отрисовки в вычислительном шейдере. В тесте используется два режима. В первом на GPU выполняется вычислительный шейдер для определения видимых треугольников, после чего вызовы отрисовки видимых треугольников записываются в UAV-буфер, откуда запускаются посредством ExecuteIndirect-команд, таким образом на отрисовку отправляются только видимые треугольники. Второй режим отрисовывает все треугольники подряд без отбрасывания невидимых. Для увеличения нагрузки на GPU число объектов в кадре увеличено с 1024 до 1 048 576 штук.

В этом тесте видеокарты Nvidia также всегда доминировали, и сегодняшний расклад сил это подтверждает. Производительность в тесте зависит от драйвера, командного процессора и мультипроцессоров GPU. Наш предыдущий опыт говорит также о влиянии программной оптимизации драйвера на результаты теста, и в этом смысле видеокартам AMD похвастать обычно нечем, включая и новые решения архитектуры RDNA 2 — даже мощнейшая RX 6900 XT далека от всех видеокарт Nvidia. Рассматриваемая сегодня GeForce RTX 3080 Ti справилась с задачей на уровне топовой RTX 3090, а RTX 3080 от них немного отстала.

Последний пример с поддержкой D3D12 — известный тест nBody Gravity. В этом примере из SDK показана расчетная задача гравитации N-тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация. Для увеличения нагрузки на GPU число N-тел в кадре было увеличено с 10 000 до 64 000.

По количеству кадров в секунду видно, что эта вычислительная задача довольно сложна, хотя современные GPU справляются с ней заметно легче предыдущих поколений. Сегодняшняя новинка GeForce RTX 3080 Ti, основанная на топовом графическом процессоре GA102, показала результат даже чуть лучше, чем RTX 3090, но их результаты в пределах погрешности измерений. RTX 3080 от них немного отстает, а единственная Radeon в этой задаче явно не раскрыла свои возможности и очень сильно проиграла.

В качестве дополнительного вычислительного теста с поддержкой Direct3D12 мы взяли известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Для верности мы протестировали видеокарты сразу в двух графических тестах.

Если рассматривать производительность новой модели GeForce RTX 3080 Ti в этой задаче по сравнению с RTX 3090, то новинка медленнее этой модели примерно настолько, что и должно быть по теории — порядка 3%-5%. А вот сравнение с RTX 3080 и обеими моделями Radeon показывает, что все представленные карты очень близки друг к другу, что делает тестирование не особо интересным. Возможно, все GPU ограничивает сравнительно низкое тестовое разрешение 2560x1440, выбранное нами пару лет назад. Еще один кандидат на выбывание из синтетики, ну или на повышение тестового разрешения хотя бы.

Тесты трассировки лучей

Одним из первых тестов производительности трассировки лучей стал бенчмарк Port Royal создателей известных тестов серии 3DMark. Этот тест работает на всех графических процессорах с поддержкой DirectX Raytracing API. Мы проверили несколько видеокарт в разрешении 2560×1440 при различных настройках, когда отражения рассчитываются при помощи трассировки лучей в двух режимах, а также традиционным для растеризации методом.

Бенчмарк показывает сразу несколько новых возможностей применения трассировки лучей через DXR API, в нем используются алгоритмы отрисовки отражений и теней с применением трассировки, но тест в целом не слишком хорошо оптимизирован и очень сильно загружает в том числе и мощные GPU. Но для сравнения производительности разных GPU в этой конкретной задаче тест отлично подходит.

Тест всегда хорошо показывает как разницу в поколениях видеокарт Nvidia, так и разницу в подходах двух компаний. Рассматриваемая сегодня модель RTX 3080 Ti проигрывает RTX 3090 совсем чуть-чуть, как и должно быть по большинству теоретических показателей. Немного настораживает лишь то, что с включением трассировки лучей большей сложности разница между топовыми моделями увеличилась. А вот конкурент в виде RX 6900 XT явно отстает, что неудивительно — трассировка лучей в его исполнении явно менее эффективна.

Позднее вышел еще один подтест 3DMark, направленный на тестирование производительности трассировки лучей — DirectX Raytracing. В отличие от предыдущего, он не гибридный, и не использует растеризацию вовсе, а только трассировку лучей, поэтому гораздо лучше отражает скорость GPU именно по возможностям аппаратного ускорения трассировки. Сцена в бенчмарке используется уже известная нам по другим подтестам 3DMark, и она довольно небольшая — BVH-структура в теории может поместиться в Infinity Cache, что может помочь новым видеокартам серии Radeon RX 6000.

Новая модель GeForce RTX 3080 Ti лишь слегка отстала от RTX 3090 на том же чипе, но менее урезанном, и обе они заметно быстрее RTX 3080. И очень хорошо заметно улучшение в RT-ядрах по сравнению с RTX 2080 Ti из прошлого поколения. Что касается условных конкурентов от AMD, то RX 6900 XT также уступает новинке чуть ли не вдвое, и конкурентом в таких задачах вряд ли сможет быть. Выделенные RT-ядра Nvidia, использующие модель MIMD, выполняют заметно большую часть работы и более универсальны, они не теряют в производительности при включении трассировки так сильно, как ядра Ray Accelerator + обычные SIMD-ядра у решений AMD.

Переходим к полусинтетическим бенчмаркам, которые сделаны на игровых движках, и соответствующие проекты должны выйти в скором времени. Первым тестом стал Boundary — один из китайских игровых проектов с поддержкой DXR и DLSS. Это бенчмарк с очень серьезной нагрузкой на GPU, трассировка лучей в нем используется весьма активно — и для сложных отражений с несколькими отскоками луча, и для мягких теней, и для глобального освещения. Также в тесте используется технология DLSS, качество которой можно настраивать, и мы протестировали два варианта — без DLSS, чтобы сравнить с AMD Radeon, и с максимально возможным качеством для DLSS.

Без включения DLSS даже в Full HD-разрешении приемлемо работают только мощные видеокарты серии GeForce RTX 30, а карты RX 6000 сильно отстают от них, ну а 4K-разрешение на GPU неиграбельно вообще. Новая модель RTX 3080 Ti снова лишь чуть отстала от RTX 3090, что объяснимо. Новинка заметно опережает RTX 3080 в низком разрешении, а вот результат в 4K для всех трех карт Nvidia отличается не сильно. Результаты Radeon ничего нового не показали, в тестах трассировки лучей они не могут конкурировать с новыми GPU от Nvidia. Тем более, что у них есть еще и поддержка DLSS:

В 4K-разрешении только старшие видеокарты линейки RTX 30 обеспечивают приемлемую частоту кадров с DLSS, хотя в реальных условиях можно использовать и менее качественный вариант этой технологии. Результат новой GeForce RTX 3080 Ti чуть хуже, чем у RTX 3090, а RTX 3080 осталась позади, что объяснимо теоретически. Новинка вполне позволяет играть в 4K при максимальных настройках с включением DLSS, что и обещает компания Nvidia. Правда, может понадобиться включение DLSS не уровня Quality, а менее качественное — если хочется получить стабильные 60 FPS.

Рассмотрим еще один полуигровой бенчмарк, также основанный на грядущей китайской игре — Bright Memory. Интересно, что оба теста довольно похожи по результатам и по качеству изображения, хотя по тематике они совсем разные. И все же этот бенчмарк даже еще чуть более требователен, особенно конкретно к производительности трассировки лучей. Жаль, что на видеокартах AMD он не работает, требуя именно Nvidia RTX.

В этом тесте новая модель на топовом графическом процессоре GA102 показала ожидаемый результат, уступив RTX 3090 не так уж много, а вот RTX 3080 в высоком разрешении отстала от новинки довольно сильно — возможно, тут сказывается больший объем видеопамяти на RTX 3080 Ti. Что касается разницы между RTX 3080 Ti и RTX 2080 Ti, то новинка до двух раз быстрее аналога по позиционированию из прошлого поколения, как Nvidia и обещала.

Вычислительные тесты

Мы продолжаем поиск бенчмарков, использующих OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается довольно старый и не слишком хорошо оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.

Рассматриваемая сегодня модель GeForce RTX 3080 Ti отстает от RTX 3090 примерно настолько, насколько и должна по теории. Да и RTX 3080 недалека от них. Такой результат позволяет опередить обе Radeon, и особенно это заметно по самому сложному подтесту, отставание RX 6900 XT в котором оказалось почти двукратным! Это при том, что никакие аппаратные возможности по ускорению трассировки лучей тест не использует.

По сравнению с Turing, подобные математически-интенсивные нагрузки с большим влиянием кэширования лучше подходят для новой архитектуры Ampere, и в этом тесте новые GPU выступают лучше предшественников аналогичной сложности и цены. Мы можем сравнить новинку с RTX 2080 Ti, и она оказалась также почти вдвое медленнее, чем RTX 3080 Ti.

Рассмотрим еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark — это тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества новых видеокарт. В прошлых тестах мы использовали разные версии бенчмарка: которая выдает результат в виде времени, затраченного на рендеринг и в виде количества миллионов просчитанных путей за секунду.

Этот тест также показывает программную трассировку лучей, но на решениях архитектуры RDNA 2 нам не удалось запустить тест, к сожалению. Новая модель GeForce RTX 3080 Ti оказалась медленнее RTX 3090 всего на секунду, а RTX 3080 слегка отстала от этой пары. Очередной отличный результат в сложных вычислительных тестах для нового представителя архитектуры Ampere, который вдвое опередил аналогичное решение из предыдущего поколения — RTX 2080 Ti.

Рассмотрим еще одно приложение рендеринга — OctaneRender. Это довольно популярный рендерер, который можно использовать в большинстве приложений для создания 3D-контента, а главное, что он использует возможности CUDA и RTX, а версия OctaneRender 2020.1.5 получила поддержку Ampere. Бенчмарк на основе этого рендерера позволяет отключать RTX-ускорение и тестирует производительность сразу в нескольких тестовых сценах, отличающихся по нагрузке. Увы, но OpenCL тестом и рендерером не поддерживается. Приведем общее количество очков:

Новая модель GeForce RTX 3080 Ti ожидаемо немного уступила старшему представителю семейства, и отставание от RTX 3090 оказалось на уровне пары-тройки процентов. RTX 3080 от них прилично отстает. Очень хорошо видна разница между семействами RTX 30 и RTX 20, включение аппаратного ускорения RTX заметно сильнее сказывается на результатах Ampere — в этом виновата и повышенная производительность RT-ядер второго поколения, а также удвоенный темп FP32-вычислений и изменения в системе кэширования. В результате, новая RTX 3080 Ti почти вдвое опередила свою предшественницу, представляющую архитектуру Turing.

Тесты DLSS

Мы решили включить в материалы отдельные тесты второй версии технологии DLSS, хотя ранее уже были проведены тесты с применением DLSS в приложениях с трассировкой лучей, мы посчитали полезным сделать и отдельное тестирование в разрешении 4K. Рассмотрим результаты четырех GPU компании Nvidia в популярном разрешении с включением технологии DLSS максимально возможного качества:

Без включения DLSS 2.0, рендеринг производится в полном разрешении, что сильно сказывается на производительности, и этого уровня FPS явно недостаточно даже в случае RTX 3090 и RTX 3080 Ti. Сегодняшняя новинка отстала от старшего решения совсем немного, и даже RTX 3080 к ним близка. Если сравнить новинку с платой из семейства Turing, то без включения DLSS разница получилась почти двукратной, но снижение внутреннего разрешения рендеринга улучшило показатели RTX 2080 Ti. В любом случае подобная сложность сцены требует применения исключительно видеокарт, основанных на чипе GA102. Интересно, а потянет ли новинка разрешение 8K?

Увы, родное разрешение 8K недоступно для всех существующих GPU на сегодня. А вот включение «производительной» версии DLSS делает его использование более-менее реалистичным, но только на паре старших решений, в число которых входит и сегодняшняя героиня RTX 3080 Ti. Правда, от RTX 3090 она отстала многовато — явно больше, чем должна по теории. Возможно, здесь уже не хватает 12 ГБ памяти, но такой сценарий явно выходит за рамки типичного игрового использования даже в среде энтузиастов.

Тесты криптографии

Недавно мы ввели еще один раздел неграфических вычислений на GPU — криптографические вычисления, а раньше тут был еще и связанный с ними майнинг криптовалют, но теперь они выделены в практические тесты, наряду с игровыми. Так что в подразделе осталось только одно приложение — hashcat. Это очень быстрый инструмент для «восстановления паролей» (ну, или их взлома, хотя такое наименование разработчики не любят, конечно). Программное обеспечение использует как возможности CPU, так и GPU при помощи OpenCL, а алгоритмов хэширования поддерживается очень много, среди них хэши Microsoft LM, MD4, MD5, семейство SHA, форматы Unix Crypt, MySQL и Cisco PIX.

Многие алгоритмы можно взломать («восстановить») за короткое время при помощи ускорения подбора на графическом процессоре. Кроме банальной атаки «грубой силой» (brute-force), поддерживаются маски — например, стандартная маска для многих паролей в виде первой заглавной буквы и двух или четырех цифр в конце, обозначающих год. На GPU подобные задачи исполняются очень быстро — заметно быстрее, чем на CPU, и ненадежные пароли взломать становится гораздо проще.

Результаты вполне соответствуют нашим ожиданиям. Новая модель RTX 3080 Ti уступила более мощной RTX 3090 совсем немного — соответственно теории. RTX 3080 отстает, но несущественно, как и должна. Radeon RX 6900 XT и RX 6800 XT показали скорость вычислений явно ниже. RX 6800 XT близка скорее к RTX 3070, чем к RTX 3080. Соответственно, и при майнинге должно было быть примерно такое соотношение сил. Должно было, если бы Nvidia не урезала хэшрейт RTX 3080 Ti при майнинге эфира — самой популярной у GPU-майнеров криптовалюты. Наши практические тесты майнинга на новом GPU ищите рядом с игровыми тестами, так как они стали одними из самых важных.

Тестирование: игровые тесты

Список инструментов тестирования

Во всех играх использовалось максимальное качество графики в настройках.

  • Hitman III (IO Interactive/IO Interactive)
  • Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 1.2
  • Death Stranding (505 Games/Kojima Productions)
  • Assassin’s Creed Valhalla (Ubisoft/Ubisoft)
  • Watch Dogs: Legion (Ubisoft/Ubisoft)
  • Control (505 Games/Remedy Entertainment)
  • Godfall (Gearbox Publishing/Counterplay Games)
  • Resident Evil Village (Capcom/Capcom)
  • Shadow of the Tomb Raider (Eidos Montreal/Square Enix), HDR включен
  • Metro Exodus (4A Games/Deep Silver/Epic Games)

Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1200, 2560×1440 и 3840×2160

Hitman III

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +7,4 +10,4 +12,3
GeForce RTX 3080 Ti GeForce RTX 3090 −0,4 −4,9 −2,3
GeForce RTX 3080 Ti Radeon RX 6800 XT −4,0 −1,9 −5,9
GeForce RTX 3080 Ti Radeon RX 6900 XT −7,1 −9,4 −11,7

Cyberpunk 2077

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +4,5 +12,2 +11,9
GeForce RTX 3080 Ti GeForce RTX 3090 0,0 0,0 +1,5
GeForce RTX 3080 Ti Radeon RX 6800 XT +7,5 +10,7 +20,0
GeForce RTX 3080 Ti Radeon RX 6900 XT −1,7 +5,1 +13,8

Death Stranding

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +2,4 +7,3 +12,0
GeForce RTX 3080 Ti GeForce RTX 3090 +0,6 −7,4 −2,6
GeForce RTX 3080 Ti Radeon RX 6800 XT −2,2 +11,7 +14,3
GeForce RTX 3080 Ti Radeon RX 6900 XT −2,2 −2,4 +0,9

Assassin’s Creed Valhalla

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +6,5 +3,8 +10,9
GeForce RTX 3080 Ti GeForce RTX 3090 0,0 −6,8 −4,7
GeForce RTX 3080 Ti Radeon RX 6800 XT −15,4 −11,8 −1,6
GeForce RTX 3080 Ti Radeon RX 6900 XT −19,5 −16,3 −7,6

Watch Dogs: Legion

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +5,3 +5,2 +7,8
GeForce RTX 3080 Ti GeForce RTX 3090 −2,0 −4,7 −3,5
GeForce RTX 3080 Ti Radeon RX 6800 XT +11,2 8,0 +14,6
GeForce RTX 3080 Ti Radeon RX 6900 XT +1,0 +1,3 +1,9

Control

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +11,3 +11,9 +11,8
GeForce RTX 3080 Ti GeForce RTX 3090 −2,5 −3,4 −8,1
GeForce RTX 3080 Ti Radeon RX 6800 XT +18,8 +27,0 +29,5
GeForce RTX 3080 Ti Radeon RX 6900 XT +12,9 +14,1 +7,5

Godfall

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +7,8 +9,6 +10,3
GeForce RTX 3080 Ti GeForce RTX 3090 −1,6 −2,8 −4,5
GeForce RTX 3080 Ti Radeon RX 6800 XT −5,3 +1,0 +3,2
GeForce RTX 3080 Ti Radeon RX 6900 XT −8,1 −8,0 −4,5

Resident Evil Village

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +10,1 +11,9 +12,0
GeForce RTX 3080 Ti GeForce RTX 3090 −1,2 −1,6 −0,9
GeForce RTX 3080 Ti Radeon RX 6800 XT −9,1 −3,6 +7,7
GeForce RTX 3080 Ti Radeon RX 6900 XT −16,7 −12,6 −3,4

Shadow of the Tomb Raider

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +7,9 +8,1 +8,9
GeForce RTX 3080 Ti GeForce RTX 3090 −2,1 0,0 −5,2
GeForce RTX 3080 Ti Radeon RX 6800 XT +3,0 +8,9 +14,6
GeForce RTX 3080 Ti Radeon RX 6900 XT −2,1 +4,7 +10,0

Metro Exodus

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +8,5 +12,1 +12,5
GeForce RTX 3080 Ti GeForce RTX 3090 0,0 −3,2 −3,6
GeForce RTX 3080 Ti Radeon RX 6800 XT +9,3 +13,2 +9,5
GeForce RTX 3080 Ti Radeon RX 6900 XT +3,7 +5,3 +2,5

В целом RTX 3080 Ti лишь чуть-чуть не догнал самого старшего собрата RTX 3090 (хотя в ряде игр и разрешений они шли наравне), прилично оторвавшись от RTX 3080. Поэтому логично уже будет сравнить RTX 3080 Ti с RX 6900 XT, а не с 6800 XT.

Большинство игр все еще не поддерживают технологию трассировки лучей, также на рынке еще очень много видеокарт, аппаратно не поддерживающих RT. То же самое справедливо и для «умной» технологии антиалиасинга Nvidia DLSS. Поэтому самые массовые тесты мы по-прежнему проводим в играх без трассировки лучей. Тем не менее, на сегодня уже половина из регулярно тестируемых нами видеокарт поддерживает технологию RT, поэтому мы проводим тесты не только с использованием обычных методов растеризации, но и с включением RT и/или DLSS. Понятно, что в этом случае видеокарты семейства AMD Radeon RX 6000 участвуют в тестах без аналога DLSS (ждем, когда компания реализует обещанный аналог и ускорит обсчет трассировки лучей).

Результаты тестов с включенной аппаратной трассировкой лучей (и DLSS) в разрешениях 1920×1200, 2560×1440 и 3840×2160

Cyberpunk 2077, RT

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +5,7 +11,4 +11,8
GeForce RTX 3080 Ti GeForce RTX 3090 0,0 0,0 +2,7
GeForce RTX 3080 Ti Radeon RX 6800 XT +94,7 +81,5 +153,3
GeForce RTX 3080 Ti Radeon RX 6900 XT +76,2 +48,5 +100,0

Cyberpunk 2077, RT+DLSS

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +4,0 +9,7 +10,6
GeForce RTX 3080 Ti GeForce RTX 3090 +1,0 −2,9 +2,0
GeForce RTX 3080 Ti Radeon RX 6800 XT +171,1 +151,9 +246,7
GeForce RTX 3080 Ti Radeon RX 6900 XT +145,2 +106,1 +173,7

Death Stranding, DLSS

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +2,3 +3,6 +6,6
GeForce RTX 3080 Ti GeForce RTX 3090 +0,6 +1,2 0,0
GeForce RTX 3080 Ti Radeon RX 6800 XT −1,1 +20,0 +48,0
GeForce RTX 3080 Ti Radeon RX 6900 XT −1,1 +4,8 +30,6

Watch Dogs: Legion, RT

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +9,8 +7,8 +10,3
GeForce RTX 3080 Ti GeForce RTX 3090 −2,9 −3,5 −3,0
GeForce RTX 3080 Ti Radeon RX 6800 XT +31,4 +37,5 +33,3
GeForce RTX 3080 Ti Radeon RX 6900 XT +24,1 +25,0 +10,3

Watch Dogs: Legion, RT+DLSS

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +8,1 +5,8 +10,0
GeForce RTX 3080 Ti GeForce RTX 3090 +0,8 −4,4 −2,9
GeForce RTX 3080 Ti Radeon RX 6800 XT +160,8 +172,5 +175,0
GeForce RTX 3080 Ti Radeon RX 6900 XT +146,3 +147,7 +127,6

Control, RT

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +10,8 +10,6 +18,8
GeForce RTX 3080 Ti GeForce RTX 3090 −1,9 −2,7 −5,0
GeForce RTX 3080 Ti Radeon RX 6800 XT +68,9 +87,2 +72,7
GeForce RTX 3080 Ti Radeon RX 6900 XT +60,9 +69,8 +46,2

Control, RT+DLSS

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +9,0 +9,8 +14,3
GeForce RTX 3080 Ti GeForce RTX 3090 −4,0 −3,4 −4,5
GeForce RTX 3080 Ti Radeon RX 6800 XT +137,7 +187,2 +190,9
GeForce RTX 3080 Ti Radeon RX 6900 XT +126,6 +160,5 +146,2

Resident Evil Village, RT

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +10,5 +10,4 +13,7
GeForce RTX 3080 Ti GeForce RTX 3090 −2,8 −1,7 −2,4
GeForce RTX 3080 Ti Radeon RX 6800 XT +26,9 +24,5 +25,8
GeForce RTX 3080 Ti Radeon RX 6900 XT +17,1 +17,0 +16,9

Shadow of the Tomb Raider, RT

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +6,9 +10,2 +12,7
GeForce RTX 3080 Ti GeForce RTX 3090 −7,7 −4,9 −2,7
GeForce RTX 3080 Ti Radeon RX 6800 XT +52,1 +83,0 +73,2
GeForce RTX 3080 Ti Radeon RX 6900 XT +44,0 +70,2 +65,1

Metro Exodus, RT

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +9,5 +13,4 +15,0
GeForce RTX 3080 Ti GeForce RTX 3090 −4,2 −3,8 −9,8
GeForce RTX 3080 Ti Radeon RX 6800 XT +37,3 +40,7 +48,4
GeForce RTX 3080 Ti Radeon RX 6900 XT +29,6 +28,8 +31,4

Metro Exodus, RT+DLSS

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce RTX 3080 Ti GeForce RTX 3080 +10,9 +12,5 +13,6
GeForce RTX 3080 Ti GeForce RTX 3090 −1,0 −2,2 −4,3
GeForce RTX 3080 Ti Radeon RX 6800 XT +52,2 +66,7 +116,1
GeForce RTX 3080 Ti Radeon RX 6900 XT +43,7 +52,5 +91,4

У Radeon RX 6000 по-прежнему мы видим очень серьезное падение производительности при активации технологии RT, в данном случае в выигрышном свете смотрится не только RTX 3080 Ti, но и предыдущие даже менее мощные продукты, как-то RTX 3080 и 3070. Увы, это ахиллесова пята нынешнего поколения ускорителей Radeon. Конечно, применение трассировки лучей в целом вызывает падение производительности у всех карт, поддерживающих данную технологию, однако у GeForce RTX 30, во-первых, мощные и отдельные блоки RT-ядер, во-вторых, имеется поддержка «умного» антиалиасинга DLSS, который помогает поднять скорость, компенсируя падение от включения RT (и даже выводя ускоритель «в плюс»). Всего этого у продуктов AMD пока нет (ждем выхода обещанной технологии FidelityFX Super Resolution).

Учитывая, что RTX 3080 Ti по производительности находится прямо рядом с RTX 3090, а последний мы уже исследовали в работе в разрешении 8К, то логично было бы протестировать и новинку в этом супер-огромном разрешении, разумеется, с применением DLSS и трассировки лучей.

Результаты тестов с включенной аппаратной трассировкой лучей (и DLSS) в разрешении 7680×4320 (8К)

Cyberpunk 2077, RT+DLSS

Death Stranding, DLSS

Watch Dogs: Legion, RT+DLSS

Control, RT+DLSS

Metro Exodus, RT+DLSS

Да, разумеется, в целом может показаться, что средние скорости не такие уж высокие, плюс может возникнуть критика применения DLSS (ну типа все же качество картинки уже не 100%), но стоит отметить, что это все же начальный этап вхождения в 8К, и понятно, что только некоторые игры дадут прилично поиграть в таком разрешении при условии сохранения всех высоких настроек графики. Тем не менее, можно отметить, что все же поиграть можно, и неплохо, учитывая при этом, что 8К пока доступен на телевизорах с очень большими размерами (от 55″), а значит эффект от игр на таких огромных «мониторах» может быть сногсшибательным. А насчет DLSS мы уже ранее исследовали, что потерь в качестве от применения данной технологии практически нет даже при включении режима Balanced (не говоря о Quality).

Рейтинг iXBT.com

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:

  1. Вариант рейтинга iXBT.com без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по самому слабому ускорителю — GeForce GTX 1650 (то есть сочетание скорости и функций GeForce GTX 1650 приняты за 100%). Рейтинги ведутся по 28 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят GeForce RTX 3080 Ti и его конкуренты.

Рейтинг приведен суммарно для всех трех разрешений.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
01 RTX 3090 24 ГБ, 1695—1965/19500 910 30 300 000
02 RX 6900 XT 16 ГБ, 2015—2470/16000 900 55 165 000
03 RTX 3080 Ti 12 ГБ, 1665—1965/19000 890 45 200 000
04 RX 6800 XT 16 ГБ, 2015—2401/16000 840 53 160 000
05 RTX 3080 10 ГБ, 1710—1965/19000 810 33 245 000

Если мы рассматриваем классические игры (без трассировки лучей и/или DLSS), то прекрасно видно, что RTX 3080 Ti прилично оторвался от RTX 3080, обошел соперника в лице RX 6800 XT и практически догнал RX 6900 XT. Да и до RTX 3090 не так много осталось (интересно будет посмотреть, что покажут нереференсные версии карт от партнеров Nvidia с фабрично повышенными частотами: по идее и RTX 3090 должен быть поверженным, иначе смысла не будет в разгоне).

  1. Вариант рейтинга iXBT.com с включением RT

Рейтинг составлен по 8 тестам с применением технологии трассировки лучей и/или DLSS (результаты Radeon RX 6000 учтены только в 4 тестах без DLSS). На сегодня RT поддерживается ускорителями серий Nvidia GeForce RTX и AMD Radeon RX 6000. Этот рейтинг нормирован по GeForce RTX 2060 (то есть сочетание скорости и функций GeForce RTX 2060 приняты за 100%).

Рейтинг приведен суммарно для всех трех разрешений.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
01 RTX 3090 24 ГБ, 1695—1965/19500 350 12 300 000
02 RTX 3080 Ti 12 ГБ, 1665—1965/19000 340 13 200 000
03 RTX 3080 10 ГБ, 1710—1965/19000 310 13 245 000
06 RX 6900 XT 16 ГБ, 2015—2470/16000 190 12 165 000
10 RX 6800 XT 16 ГБ, 2015—2422/16000 160 10 160 000

Ничего нового мы тут не скажем. В играх с трассировкой лучей соперничество новых Radeon с GeForce RTX происходит на уровень ниже: даже RTX 3080 сильно выше по рейтингу, чем топовый RX 6900 XT.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатели предыдущего рейтинга разделить на цены соответствующих ускорителей. Учитывая возможности карты GeForce RTX 3080 Ti и ее явную нацеленность на использование в разрешениях уровня 4К, приводим рейтинг только для разрешения 3840×2160 (поэтому цифры в рейтинге iXBT.com иные). Для расчета рейтинга полезности использованы розничные цены на начало июня 2021 года.

Внимание! По известным причинам расчет рейтингов полезности сейчас стал бессмысленным, мы приводим эти рейтинги просто по традиции, но при сложившейся ситуации на рынке выводы на их основе делать нельзя. Опять же, для GeForce RTX 3080 Ti мы взяли ожидаемую розничную цену, а какой она будет в реальности, мы на момент подготовки обзора не знали.

  1. Вариант рейтинга полезности без включения RT
Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
02 RX 6900 XT 16 ГБ, 2015—2470/16000 110 1807 165 000
03 RX 6800 XT 16 ГБ, 2015—2401/16000 103 1651 160 000
05 RTX 3080 Ti 12 ГБ, 1665—1965/19000 91 1818 200 000
10 RTX 3080 10 ГБ, 1710—1965/19000 67 1638 245 000
12 RTX 3090 24 ГБ, 1695—1965/19500 63 1883 300 000
  1. Вариант рейтинга полезности с включением RT
Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
01 RTX 3080 Ti 12 ГБ, 1665—1965/19000 20 405 200 000
02 RX 6900 XT 16 ГБ, 2015—2470/16000 17 285 165 000
05 RX 6800 XT 16 ГБ, 2015—2422/16000 16 248 160 000
10 RTX 3080 10 ГБ, 1710—1965/19000 15 356 245 000
11 RTX 3090 24 ГБ, 1695—1965/19500 14 420 300 000

Результаты тестирования в майнинге (mining, hashrate)

Для подсчета хэшрейта (hashrate) при майнинге «эфира» (Ethereum/ETH/ETC) и «вороны» (Ravencoin/RVN) использовался майнер T-Rex (0.20.04), фиксировался средний показатель за 2 часа в двух режимах:

  • по умолчанию (лимит потребления снижен до 70%, частота GPU снижена на 200 МГц, частота памяти по умолчанию, вентиляторы выставлены в ручном режиме на 70%)
  • оптимизация (лимит потребления снижен до 70%, частота GPU снижена на 200 МГц, частота памяти повышена на 500—1000 МГц (в зависимости от карты), вентиляторы выставлены в ручном режиме на 80%)

Для тестирования GeForce RTX 3060 использовался тот самый «утекший» драйвер версии 470.05, в котором отключена защита от майнинга, на других версиях он составляет 24/26 MH/s.

Hashrate ETH и RVN, MH/s

Тесты наглядно показали, что защита от майнинга по алгоритму ethash реально работает, сбрасывая хэшрейт в 2 раза (то есть 3080 Ti демонстрирует эффективность майнинга ETH/ETC на уровне RTX 3060Ti, Radeon RX 5700, имея при этом явно более высокую стоимость) на скринах ниже отмечено зеленым.

Стоит особо обратить внимание, что при настройках по умолчанию частота работы памяти не достигает номинальных эффективных частот в 19 ГГц, оставаясь на уровне 18.5 (отмечено фиолетовым цветом), и при этом нагрев микросхем памяти достигал 100-102 °C! Подчеркну, что продувка в корпусе приличная. То есть даже при том, что карта выдает половинный хэшрейт, она греется весьма и весьма прилично. И это мы пока говорим об алгоритме ethash.

Посмотрим теперь на алгоритм kawpow, на котором базируется Ravencoin, монета, которая за последнее время сильно выросла по популярности. Переход на нее очень прост, ею торгуют все биржи, популярные пулы также принимают майнинг по ней. Да и в майнере T-Rex потребуется лишь скорректировать батник.

Если посмотреть на результаты хэшрейта по RVN в целом (на диаграмме выше), то есть понимание, что он примерно в 2 раза ниже, чем аналог по ETH. Особо подчеркну для несведущих, что абсолютное число хэшрейта играет роль только в рамках той или иной монеты. Сравнивать производительность видеокарт между монетами бесполезно. Итак, несмотря на то, что мы вроде как видим 51-52 MH/s (зеленым цветом) у 3080 Ti, это не половинный, а полноценный хэшрейт по RVN! И мы понимаем, что в данном случае защита от майнинга не работает. При этом снова частота памяти (фиолетовым цветом) не достигла номинала, но перегрев еще выше, уже 106 градусов на GDDR6X, что приближается к критической отметке в 110, после чего видеокарта входит в режим троттлинга и сброса всех частот.

Таким образом, мы получили два вывода:

  1. Защита работает только на алгоритме ethash, и если вскоре популярность майнинга на видеокартах перекинется на иные алгоритмы типа kawpow или octopus (тут уж все непредсказуемо), то защита будет сведена к нулю;
  2. Видеокарты семейства GeForce RTX 3080/3080 Ti/3090 Founders Edition очень плохо годятся для майнинга, ибо перегрев памяти GDDR6X происходит даже в случае приличного охлаждения внутри корпуса: надо ставить крайне агрессивное охлаждение с вытекающими проблемами шума.

Оптимизация настроек работы видеокарт под майнинг в нашем случае не предусматривает сильного разгона видеопамяти, также обязательным является внешний обдув видеокарт. Особо тщательно надо следить за нагревом GDDR6X у GeForce RTX 3080/3090, ибо максимум для этой памяти — 110 градусов, и она долго не проживет, постоянно работая в условиях нагрева выше 100 °C.

Выводы

Что можно сказать про Nvidia GeForce RTX 3080 Ti в целом?

Если абстрагироваться от цен, то очевидно, что GeForce RTX 3080 Ti — самый топовый игровой продукт на сегодня. Да, GeForce RTX 3090 продолжает выпускаться, однако он предназначен не только для игр, но и — даже в большей степени — для профессиональных задач: для создания 3D-моделей, для САПР-проектирования и т. п. Именно поэтому у GeForce RTX 3090 такой огромный для игрового ускорителя объем памяти в 24 ГБ, который если и будет востребован играми, то очень и очень нескоро. А у GeForce RTX 3080, что был на ступень ниже, уже всего 10 ГБ памяти. Впрочем, на момент анонса осенью 2020 года такого объема памяти хватало для игр. Разрыв же между GeForce RTX 3090 и GeForce RTX 3080 в основном обуславливался именно огромной разницей в объеме памяти, ну и разницей в районе 15%-17% производительности.

Сам собой напрашивался вывод, что между ними должен появиться некий промежуточный продукт, который в играх будет работать на уровне GeForce RTX 3090, но будет иметь гораздо меньше памяти, то есть с чисто игровым позиционированием. Конечно, нынешняя новинка тоже подходит для использования в профессиональном ПО, ведь она обладает производительностью почти как у GeForce RTX 3090, а объем видеопамяти у нее на 20% больше, чем у GeForce RTX 3080. Платформа Studio позволяет использовать особенности решений всего семейства GeForce RTX 30 в широком наборе ПО, включая обработку видео, рендеринг, 3D-анимацию, архитектурные приложения и многое другое.

Так появился GeForce RTX 3080 Ti, который продемонстрировал производительность лишь чуть ниже, чем у GeForce RTX 3090, а ряде тестов они вообще на равных. Условное ценовое позиционирование у него ближе к GeForce RTX 3090, чем к GeForce RTX 3080: рекомендованная цена для США — 1200 долларов, тогда как у GeForce RTX 3080 — 700, а у GeForce RTX 3090 — 1500. (Понятно, что сейчас из-за жуткого дефицита видеокарт, в особенности 30-й серии, все ценники в несколько раз выше рекомендованных.)

По логике ценообразования последних месяцев, GeForce RTX 3080 Ti должен стоить от 260 до 290 тысяч рублей (между GeForce RTX 3080 и GeForce RTX 3090 на момент подготовки обзора), хотя рекомендованная для российского рынка цена — 116 тысяч рублей. С начала 2021 года ценники определяются спросом майнеров, а не геймеров, и видеокарты стоят пропорционально их хэшрейту, а не возможностям в играх. Однако одна из главных «фишек» GeForce RTX 3080 Ti — защита от майнинга. Правда, это не комплексная и полноценная защита от майнинга любой криптовалюты: алгоритмов очень много, учесть все — физически невозможно (вся мощь GPU будет уходить на анализ того, что же это такое на нем сейчас считается), да и новые монеты плодятся постоянно. Поэтому как GeForce RTX 3080 Ti (GeForce RTX 3070 Ti), так и выпускаемые с некоторых пор видеокарты на базе GeForce RTX 3060 Ti/3070/3080 оснащаются защитой лишь против самого популярного алгоритма ethash (для криптовалют ETH/ETC). Защита внедряется на новые LHR(Low/Lite Hash Rate)-видеокарты аппаратно: сам графический процессор используется прежний, но изменяется ID карты и убирается возможность прошивать альтернативный BIOS. Новые ID не поддерживаются прежними версиями драйверов, а все новые версии уже имеют встроенное определение алгоритма ethash, и судя по тому, что GeForce RTX 3060 с программной защитой до сих пор выдает полноценный хэшрейт на ethash только на утекшей версии драйверов 470.05, где этой защиты нет, взломать драйверы Nvidia пока никому не удалось. Это вселяет надежду. И поэтому мы в качестве предполагаемой цены GeForce RTX 3080 Ti взяли 200 тысяч рублей: майнят на видеокартах пока в основном Ethereum, а для него хэшрейт GeForce RTX 3080 Ti сравнительно невысокий, и майнерам этот продукт должен быть менее интересен.

В остальном с точки зрения технологий (в играх и не только) для GeForce RTX 3080 Ti актуально все не раз сказанное ранее в отношении архитектуры Nvidia Ampere. Прежде всего, конечно же, это невероятная мощь в играх, для которых этот продукт и выпускается. GeForce RTX 3080 Ti обеспечивает полный комфорт в «классических» играх без использования трассировки лучей в разрешении 4К при условии максимального качества графики, то же самое справедливо и для игр с использованием трассировки лучей при задействовании умного антиалиасинга DLSS. Более того, большинство игр с RT будут играбельны в 4K при максимальном качестве графики и без DLSS. Словом, с этим ускорителем снижать разрешение вообще не потребуется. Некоторые игры при использовании DLSS демонстрируют хорошую производительность даже в 8К, и наличие не 24 (как у GeForce RTX 3090), а 12 ГБ памяти не мешает GeForce RTX 3080 Ti.

Кроме того, GeForce RTX 3080 Ti, как и все семейство GeForce RTX 30, предлагает интересные решения Nvidia, о которых мы уже неоднократно говорили: поддержка стандарта HDMI 2.1, позволяющего выводить 4K-изображение при 120 Гц или картинку в 8K при помощи одного кабеля, аппаратное декодирование видеоданных в формате AV1, технология RTX IO, способная в будущем обеспечить быструю передачу и распаковку данных с накопителей прямо в GPU, а также технология снижения задержек Reflex, полезная для киберспортсменов. Об этом мы говорили в начале материала.

Что касается конкретной видеокарты Nvidia GeForce RTX 3080 Ti Founders Edition (12 ГБ) с точки зрения потребительских характеристик, то плата у нее стандартная по длине, сама карта занимает два слота в системном блоке. Однако если шум GeForce RTX 3080 FE еще был терпимым, то здесь, вследствие повышенного энергопотребления (а СО, по сути, осталась той же, что у GeForce RTX 3080), уровень шума вырос, карта очень громкая под высокой нагрузкой. Для ее использования обязательно требуется хорошая вентиляция в корпусе. Даже при том, что она частично удаляет горячий воздух за пределы корпуса, все равно очень много тепла остается внутри.

Напомним, что все новые продукты Nvidia — GeForce RTX 3080 Ti, GeForce RTX 3070 Ti, LHR-версии предыдущих моделей — имеют поддержку Resizable Bar (надо лишь обновить BIOS материнской платы, чтобы эта функциональность PCIe была включена). То есть новое поколение видеокарт GeForce RTX 30 имеет ту же прибавку в скорости, что и видеокарты семейства Radeon RX 6000, поскольку их технология AMD Smart Access Memory — это и есть Resizable Bar.

В заключение еще раз констатируем: Nvidia GeForce RTX 3080 Ti прекрасно подходит для игр в разрешении 4К почти без условий и ограничений.

Благодарим компанию Nvidia Russia и лично Ирину Шеховцову за предоставленную на тестирование видеокарту

Благодарим компанию TeamGroup и лично Ethnie Lin за предоставленную оперативную память для тестового стенда

Для тестового стенда: процессор AMD Ryzen 9 5950X предоставлен компанией AMD, а также материнская плата ROG Crosshair Dark Hero предоставлена компанией Asus

Источник: ixbt.com
.:: Статистика ::.
Пользователи
HTTP: 2
IRC: 0
Jabber: 0
( состояние на 15:26 )
ADSL-газета: Ежедневно свежие анекдоты, гороскоп, погода, новости, ТВ-программа, курс валют

Интересности из Интернета: Интересные статьи на разнообразные темы, найденные на просторах интернета

Компьютерная консультация

Единый личный кабинет