- Что такое технология cuda?
- Виды разъемов для подключения кулера в компьютере
- Замена кулера процессора
- Как серьезно увеличить хешрейт на алгоритме ethash?
- Какие команды можно использовать в утилите amdmemorytweak?
- Какие особенности имеют модули памяти gddr6x?
- О хешрейте видеокарт nvidia geforce rtx 3070ti/3080ti при майнинге
- Устройство и ремонт кулера пк
Что такое технология cuda?
CUDA (Compute Unified Device Architecture) — это технология многопотоковых компьютерных вычислений, созданная компанией NVIDIA. Она позволяет значительно увеличить производительность при проведении сложных расчетов за счет распараллеливания на множестве вычислительных ядер.
Приложения CUDA используются для обработки видео и аудио, моделирования физических эффектов, в процессе разведки месторождений нефти и газа, проектировании различных изделий, медицинской визуализации и научных исследованиях, в разработке вакцин от болезней, в том числе COVID-19, физическом моделировании и других областях.
CUDA ™ — это архитектура параллельных вычислений общего назначения, которая позволяет решать сложные вычислительные задачи с помощью GPU. CUDA поддерживает операционные системы Linux и Windows. Чем больше ядер CUDA имеет видеокарта и чем больше частота их работы, тем большую производительность она может обеспечить.
Каждая дополнительна единица вычислительной мощности требует соответствующего количества потребленной электроэнергии. Чем меньший технологический процесс используется при производстве вычислительных ядер, тем меньшие напряжения используются для их питания и, соответственно снижается потребление.
Поэтому, даже если видеокарты разных поколений имеют одинаковую теоретическую вычислительную мощность в TFlops, их эффективность кардинально отличается по КПД, в значительной мере зависящему от потребления полупроводниковых элементов, из которых состоят ядра видеопроцессоров.
Архитектура CUDA упрощенно включает набор исполняемых команд и аппаратный механизм проведения параллельных вычислений внутри графического процессора. Разработчики программного обеспечения, в том числе майнеров, для работы с CUDA обычно используют языки программирования высокого уровня (C, Фортран).
В будущем в CUDA планируется добавление полноценной поддержки C , Java и Python. Продвинутые программисты дополнительно улучшают эффективность майнеров с помощью оптимизации кода майнеров на языке более низкого (машинного) уровня – Ассемблере. В качестве примера в этом контексте можно привести Клеймор дуал майнер, который показывает высочайшую эффективность на зеленых видеокартах.
В технологии CUDA есть три важных элемента: библиотеки разработчика, среда выполнения и драйвера. Все они прямо влияют на производительность и надежность работы приложений.
Драйвер — это уровень абстракции устройств с поддержкой CUDA, который обеспечивает интерфейс доступа для аппаратных устройств. С помощью среды выполнения через этот уровень реализуется выполнение различных функций по проведению сложных вычислений.
Таблица версий CUDA, поддерживающихся в драйверах NVIDIA разных версий:
Для CUDA 6.5 нужны драйвера 340.0 , для CUDA 6.0 — 331.00, для CUDA 5.5 — не ниже 319.00.
При установке новых драйверов на видеокарты со старой версией compute capability вычисления производиться не будут.
Например, на большинство видеокарт с архитектурой Kepler (GeForce 640 — 780Ti, 910M, GTX TITAN, compute capability 3.5) нет смысла ставить драйвера новее 441.22 (Windows) или 440.33 (Linux), так как в них отсутствует поддержка compute capability 3.x.
Информация, которую нужно учитывать при установке драйверов для видеокарт Nvidia на предмет соответствия версии compute capability CUDA:
- CUDA SDK 1.0 — поддерживает версии compute capability 1.0 – 1.1 (Tesla);
- CUDA SDK 1.1 — 1.0 — версии 1.1 x (Tesla);
- CUDA SDK 2.0 — 1.0 — версии 1.1 x (Tesla);
- CUDA SDK 2.1 – 2.3.1 — версии 1.0 – 1.3 (Tesla);
- CUDA SDK 3.0 – 3.1 — 1.0 – версия 2.0 (Tesla, Fermi);
- CUDA SDK 3.2 — версии 1.0 – 2.1 (Tesla, Fermi)[32]
- CUDA SDK 4.0 – 4.2 — версии 1.0 – 2.1 x (Tesla, Fermi).
- CUDA SDK 5.0 – 5.5 — версии 1.0 – 3.5 (Tesla, Fermi, Kepler).
- CUDA SDK 6.0 — версии 1.0 – 3.5 (Tesla, Fermi, Kepler).
- CUDA SDK 6.5 — версии 1.1 – 5.x (Tesla, Fermi, Kepler, Maxwell). Последняя версия CUDA для видеокарт с поддержкой компьютерных вычислений версии 1.x (Tesla)
- CUDA SDK 7.0 – 7.5 — версии 2.0 – 5.x (Fermi, Kepler, Maxwell).
- CUDA SDK 8.0 — для версий 2.0 – 6.x (Fermi, Kepler, Maxwell, Pascal). Последняя версия CUDA для видеокарт с поддержкой компьютерных вычислений версии 2.x (Fermi) (Pascal GTX 1070Ti не поддерживается);
- CUDA SDK 9.0 – 9.2 — поддержка версий 3.0 – 7.2 (Kepler, Maxwell, Pascal, Volta). Видеокарты с архитектурой Pascal GTX 1070Ti не поддерживаются;
- CUDA SDK 10.0 – 10.2 — поддержка 3.0 – 7.5 (Kepler, Maxwell, Pascal, Volta, Turing). Это последняя версия CUDA с поддержкой компьютерных вычислений версии 3.x (Kepler);
- CUDA SDK 11.0 – 11.2- частично 3.5 – 8.6 (некоторые карты с архитектурой Kepler, Maxwell, Pascal, Volta, Turing, Ampere).
Библиотеки разработки (CUDA SDK) на практике реализуют выполнение математических операций и крупномасштабных задач параллельных вычислений.
Среда выполнения CUDA — это интерфейс разработчика плюс компоненты выполнения программного кода. Она определяет основные типы данных и функций для проведения вычислений, преобразований, управления памятью, позволяет реализовать доступ к устройствам и спланировать выполнение команд.
Программный код CUDA на практике обычно состоит из двух частей, одна из которых выполняется на CPU, а другая на GPU.
Ядро CUDA имеет три важных абстрактных понятия:
- иерархия групп потоков;
- разделяемая память;
- синхронизация барьеров,
которые могут быть достаточно легко представлены и использованы на языке программирования Си.
Программный стек CUDA состоит из нескольких уровней, аппаратного драйвера, интерфейса прикладного программирования (API) и среды его выполнения, а также двух расширенных математических библиотек общего назначения, CUFFT и CUBLAS.
Теоретически каждое новое поколение CUDA должно демонстрировать более высокую производительность за счет устранения выявленных ошибок, оптимизации кода, добавления новых алгоритмов и прочих новшеств. К сожалению, на практике это не всегда соответствует реалиям.
Виды разъемов для подключения кулера в компьютере
Для работы кулера на его обмотки необходимо подать питающее напряжение постоянного тока 12 В. Кулеры к компьютеру подсоединяется с помощью разъемов. В блоках питания компьютеров раньше кулеры тоже подсоединялись с помощью двойного разъема, а с некоторых пор стали экономить и провода запаивать непосредственно в печатную плату, что значительно усложняет смазку и замену кулера при ремонте. Приходится выпаивать провода или разрезать их и потом сращивать.
В зависимости от типа кулера разъемы используются двух, трех и четырех контактные. На двух контактный разъем питающее напряжение подается проводом черного цвета (–12 В, первый вывод) и красным проводом ( 12 В).
На трехконтактный разъем питающее напряжение подается так же, как и на двухконтактный, проводом черного цвета (–12 В, первый вывод) и красным проводом ( 12 В). Но добавлен еще один проводник желтого цвета по которому от датчика скорости вращения кулера Холла передается сигнал на материнскую плату.
Этот проводник не принимает участия в работе кулера, так как является информационным и позволяет контролировать скорость вращения на мониторе. Подключать желтый провод не обязательно, без него кулер будет работать также успешно.
У четырех контактного кулера цвета проводов отличаются. Черный – -12 В, желтый – 12 В, зеленый – датчик скорости вращения, и синий – для подачи сигнала управления скоростью вращения с материнской платы.
На материнской плате кроме разъема для подключения кулера процессора, как правило, установлено еще несколько разъемов. Все они одного типа и их легко найти. Один трехконтактный разъем предназначен для подключения кулера, установленного в корпусе системного бока.
Четырех проводные кулеры используются редко. Обычно скорость вращения кулера регулируется за счет изменения напряжения питания, которое меняется в зависимости от температуры нагрева процессора.
Цветовая маркировка проводов, выходящих из блока питания другая, на красных проводах 5 В, черных – общий провод, и желтых 12 В.
Так что при подключении кулера непосредственно к проводам, идущим от блока питания, красный провод кулера нужно подключать к желтому проводу, идущего от блока питания.
Замена кулера процессора
Кулер, установленный для охлаждения процессора компьютера стал нестерпимо постоянно шуметь. До этого шум был только в течение первых нескольких минут при включении компьютера. Это уже был сигнал, что надо кулер срочно смазать, но время было упущено. Шум, после некоторого времени прекращался потому, что остатки смазки от трения в подшипнике разогревались, текучесть масла увеличивалась, и оно попадало в подшипник, масла хватало для нормальной работы. Но, впервые минуты работы, когда кулер шумел, шел интенсивный износ подшипников, приводя его в негодность.
Смазка подшипника качения (шарикового) помогла на несколько часов и снова шум. Найти подшипники требуемого типоразмера, нереальная задача. Надо менять кулер который оказался оригинальной конструкции. Попытка найти такой же на замену не увенчалась успехом. Пришлось решать проблему исходя из существующих возможностей.
Крепится кулер обычно на радиатор процессора саморезами, которые завинчиваются в пазы между его ребрами. Если винтов сверху нигде не видно, значит надо искать защелки. чтобы освободить кулер на защелках, нужно эти защелки по очереди отвести в сторону, при этом удерживая уже отведенные, иначе они опять вернутся на место.
Работу надо проводить очень аккуратно, следить за тем, чтобы инструмент случайно не соскользнул и не ударил по материнской плате. Иногда к защелкам сложно подобраться и бывает проще снять радиатор целиком и уже потом снять кулер. Но тут надо быть готовым к тому, что придется наносить на поверхность радиатора и процессора тонкий слой теплопроводящей пасты, взамен подсохшей.
Заменить такой кулер на стандартный возможно. Достаточно изготовить несколько крепежных деталей. По техническим характеристикам хорошо для замены подходит кулер, от блока питания компьютера. Иногда, кулер такого типоразмера для дополнительного охлаждения устанавливают и в корпусе системного блока.
Из выломанных заглушек от системного блока, с места для установки дополнительных карт, сделал 2 планки. Прикрутил их к кулеру выкрученными при его демонтаже 4 винтами. От шумевшего кулера отрезал питающие провода и соединил их с проводниками нового по технологии со сдвигом.
Красный провод ( 12 В) соединяется с красным, черный (-12 В, общий) с черным. Даже если Вы случайно подключите неправильно, ничего не произойдет, просто кулер не будет работать. Желтый провод, по которому от кулера передается сигнал о частоте вращения, не подсоединял.
На 2 самореза, через просветы в крыльчатке привернул кулер к радиатору процессора. Саморезы необходимо подобрать такого диаметра, чтобы обеспечить надежную их фиксацию. Если саморез, во время работы компьютера, случайно попадет на материнскую плату, то может вывести ее из строя.
Испытания, после замены кулера, показали тихую работу компьютера и достаточное охлаждение процессора при температуре окружающей среды более 30˚С. Температура процессора при полной нагрузке, по показаниям BIOS, не превышала 60˚С.
Как серьезно увеличить хешрейт на алгоритме ethash?
Еще больше увеличить быстродействие можно путем модификации таймингов, ответственных за чтение данных. Для памяти GDDR5 это с успехом делается путем прошивки быстродействующих таймингов (обычно с частоты 1500 МГц) в более высокочастотные страпы, а также путем модификации значения REF (программой amdmemorytweak или в Claymore включением опции rxboost 1).
У видеокарт AMD серии VEGA с памятью HBM2 диапазон возможных твикингов значительно больше. У них есть смысл модифицировать значения RAS, RCDRD, RCDWR, RC, RP, RRDS, RRDL, RFC и REF.
Для практического увеличения быстродействия подсистемы памяти при майнинге на алгоритме Ethash используются:
В качестве справочных данных приведем информацию о максимальном теоретическом хешрейте на Ethash популярных видеокарт при стоковых настройках. При использовании данных из таблицы нужно учитывать, что реальный хешрейт видеокарт также зависит от производительности ядра, которое используется вычислении значений nonce.
У видеокарт с большой разрядностью шины памяти реальный хешрейт может быть значительно меньше теоретического, так как у них производительность ядра обычно отстает от пропускной способности шины памяти.
Из-за отставания производительности ядра от подсистемы памяти, реальный хешрейт на алгоритме Ethash у таких видеокарт как R9 280, R9 290, R9 295, Fury и других карт с огромной шиной памяти ниже теоретического максимума даже в Linux. У них разгон ядра сразу же откликается хорошей прибавкой в хешрейте, при этом память остается недогруженной.
У карт серии RX Vega производительность ядра значительно выше и они показывают хешрейт, более соответствующий теоретическому при сопоставимой пропускной способности памяти.
Кроме того, на хешрейт в значительной мере влияет реализация работы с памятью в драйверах операционной системой. Из-за недостатков в драйверах Windows на видеокартах R9 290/390 на поздних DAG выдает всего 18-19 MH/s, а Linux – порядка 29 MH/s. Подробнее об этом можно прочитать в статье «Как добиться от видеокарт Radeon R9 290/390 хешрейта 29-30 MH/s на Ethash».
Таблица с информацией о максимальном теоретическом хешрейте видеокарт AMD при заводских настройках подсистемы видеопамяти (без разгона):
Название видеокарты | Пропускная способность памяти (Memory Bandwidth), GB/sec | Ширина шины памяти, бит | Объем видеопамяти, GB | Тип памяти | Макс. хешрейт на Ethash (в стоке), MH/s |
Radeon R7 360 | 104 | 128 | 2 | GDDR5 | 13 |
Radeon R7 370 | 179,2 | 256 | 2 | GDDR5 | 22,4 |
Radeon R9 370X | 179,2 | 256 | 4 | GDDR5 | 22,4 |
Radeon R9 270X | 179,2 | 256 | 2 | GDDR5 | 22,4 |
Radeon R9 280 | 240 | 384 | 3 | GDDR5 | 30 |
Radeon R9 280X | 288 | 384 | 3 | GDDR5 | 36 |
Radeon R9 285 | 176 | 256 | 2 | GDDR5 | 22 |
Radeon R9 290 | 320 | 512 | 4 | GDDR5 | 40 |
Radeon R9 290X | 320 | 512 | 4 | GDDR5 | 40 |
Radeon R9 295X2 | 2х320 | 2х512 | 8 | GDDR5 | 80 |
Radeon R9 380 | 182,4 | 256 | 2 | GDDR5 | 22,8 |
Radeon R9 390 | 384 | 512 | 8 | GDDR5 | 48 |
Radeon R9 390X | 384 | 512 | 8 | GDDR5 | 48 |
Radeon R9 Fury | 512 | 4096 | 4 | HBM | 64 |
Radeon R9 Fury X | 512 | 4096 | 4 | HBM | 64 |
Radeon R9 Nano | 512 | 4096 | 4 | HBM | 64 |
Radeon RX460/560 | 112 | 128 | 2/4 | GDDR5 | 14 |
Radeon RX470 | 211,2 | 256 | 4/8 | GDDR5 | 26,4 |
Radeon RX480/580 | 256 | 256 | 4/8 | GDDR5 | 32 |
Radeon RX540 | 96 | 128 | 2/4 | GDDR5 | 12 |
Radeon RX550 | 112 | 128 | 2/4 | GDDR5 | 14 |
Radeon RX570 | 224 | 256 | 4/8 | GDDR5 | 28 |
Radeon RX590 | 256 | 256 | 8 | GDDR5 | 32 |
Radeon RX640 | 112 | 128 | 2 | GDDR5 | 14 |
RX Vega 56 | 409,6 | 2048 | 8 | HBM2 | 51,2 |
RX Vega 64 | 483,8 | 2048 | 8 | HBM2 | 60,47 |
Radeon VII | 1024 | 4096 | 16 | HBM2 | 128 |
Radeon Pro 5300M/ W5300M | 192 | 128 | 4 | GDDR6 | 24 |
Radeon Pro 5500M/ W5500M | 192 | 128 | 8/4 | GDDR6 | 24 |
RX5500/5500XT | 224 | 128 | 4 | GDDR6 | 28 |
RX5600 | 288 | 192 | 6 | GDDR6 | 36 |
RX5700 | 448 | 256 | 8 | GDDR6 | 56 |
RX5800XT | 448 | 256 | 8 | GDDR6 | 56 |
RX5900/5900XT | 672 | 384 | 12 | GDDR6 | 84 |
Таблица с информацией о максимальном теоретическом хешрейте видеокарт Nvidia при заводских настройках подсистемы видеопамяти (без разгона):
Название видеокарты | Пропускная способность памяти (Memory Bandwidth), GB/sec | Ширина шины памяти, бит | Объем видеопамяти, GB | Тип памяти | Макс. хешрейт на Ethash (в стоке), MH/s |
GTX 750Ti | 88 | 128 | 2 | GDDR5 | 11 |
GTX 760/760Ti | 192,3 | 256 | 2 | GDDR5 | 24 |
GTX 770 | 224 | 256 | 2 | GDDR5 | 28 |
GTX 780 | 288,4 | 384 | 3 | GDDR5 | 36 |
GTX 780Ti | 336,5 | 384 | 3 | GDDR5 | 42 |
GTX 950 | 106 | 128 | 2 | GDDR5 | 13,2 |
GTX 960 | 112 | 128 | 2 | GDDR5 | 14 |
GTX 970 | 224,4 | 256 | 4 | GDDR5 | 28 |
GTX 980 | 224 | 256 | 4 | GDDR5 | 28 |
GTX 980Ti | 336 | 384 | 6 | GDDR5 | 42 |
GTX 1030 | 48,06 | 64 | 2 | GDDR5 | 6 |
GTX 1050 | 112,1 | 128 | 2 или 4 | GDDR5 | 14 |
GTX 1050Ti | 112,1 | 128 | 4 | GDDR5 | 14 |
GTX 1063 | 192,2 | 192 | 3 | GDDR5 | 24 |
GTX 1066 | 192,2 | 192 | 6 | GDDR5 | 24 |
GTX 1068 | 256,3 | 256 | 8 | GDDR5 | 32 |
GTX 1070 | 256,3 | 256 | 8 | GDDR5 | 32 |
GTX 1070Ti | 256,3 | 256 | 8 | GDDR5 | 32 |
GTX 1080 | 320,3 | 256 | 8 | GDDR5 | 40 |
GTX 1080Ti | 484 | 352 | 11 | GDDR5 | 60 |
GTX 1650 | 128 | 128 | 4 | GDDR5 | 16 |
GTX 1650 Ti | 192 | 128 | 4 | GDDR6 | 24 |
GTX 1650S | 192 | 128 | 4 | GDDR6 | 24 |
GTX 1660S | 336 | 192 | 6 | GDDR6 | 42 |
GTX 1660 Ti | 288 | 192 | 6 | GDDR6 | 36 |
GeForce GTX Titan | 288,4 | 384 | 6 | GDDR5 | 36 |
Quadro GV100 | 870 | 4096 | 32 | HBM2 | 108 |
Tesla T4 | 320 | 256 | 16 | GDDR6 | 40 |
RTX2060 | 336 | 192 | 6 | GDDR6 | 42 |
RTX2060S | 448 | 256 | 8 | GDDR6 | 56 |
RTX2070 | 448 | 256 | 8 | GDDR6 | 56 |
RTX2070S | 448 | 256 | 8 | GDDR6 | 56 |
RTX2080 | 448 | 256 | 8 | GDDR6 | 56 |
RTX2080S | 495,5 | 256 | 8 | GDDR6 | 61 |
RTX2080Ti | 616 | 352 | 11 | GDDR6 | 77 |
Какие команды можно использовать в утилите amdmemorytweak?
В amdmemorytweak можно использовать следующие команды:
—gpu|—i [номера gpu, разделенные запятыми] – выбор задействованных видеокарт;
—current – показывает текущие тайминги;
—help – выводит список доступных команд. При этом нужно использовать батник такого вида:
WinAMDTweak.exe —help
Pause
Скрин батника для вывода помощи в amdmemorytweak:
В батнике для оптимизации таймингов можно изменять следующие значения для видеокарт с памятью GDDR5 (серия RX):
—CL|—cl [значение] – латентность (CAS to data return latency), уменьшать с осторожностью;
—W2R|—w2r [значение] — Write to read turn;
—R2R|—r2r [значение] — Read to read time;
—CCLD|—ccld [значение] – число циклов между записью/чтением из банки A в банку B;
—R2W|—r2w [значение] — Read to write turn;
—NOPR|—nopr [значение] — Extra cycle(s) between successive read bursts;
—NOPW|—nopw [значение] — Extra cycle(s) between successive write bursts;
—RCDW|—rcdw [значение] – число циклов from active to write;
—RCDWA|—rcdwa [значение] – число циклов from active to write with auto-precharge;
—RCDR|—rcdr [значение] – число циклов from active to read;
—RCDRA|—rcdra [значение] – число циклов from active to read with auto-precharge
—RRD|—rrd [значение] – число циклов from active bank a to active bank b;
—RC|—rc [значение] – число циклов from active to active/auto refresh;
—RFC|—rfc [значение] – период автообновления;
—TRP|—trp [значение] — Precharge command period;
—RP_WRA|—rp_wra [значение] — from write with auto-precharge to active;
—RP_RDA|—rp_rda [значение] — from write with auto-precharge to active;
—WDATATR|—wdatatr [значение]
—T32AW|—t32aw [значение]
—CRCWL|—crcwl [значение]
—CRCRL|—crcrl [значение]
—FAW|—faw [значение]
—PA2WDATA|—pa2wdata [значение]
—PA2RDATA|—pa2rdata [значение]
—ACTRD|—actrd [значение]
—ACTWR|—actwr [значение]
—RASMACTRD|—rasmactrd [значение]
—RASMACWTR|—rasmacwtr [значение]
—RAS2RAS|—ras2ras [значение]
—RP|—rp [значение]
—WRPLUSRP|—wrplusrp [значение]
—BUS_TURN|—bus_turn [значение]
Для памяти HBM2:
—CL|—cl [значение]
—RAS|—ras [значение]
—RCDRD|—rcdrd [значение]
—RCDWR|—rcdwr [значение]
—RC|—rc [значение]
—RP|—rp [значение]
—RRDS|—rrds [значение]
—RRDL|—rrdl [значение]
—RTP|—rtp [значение]
—FAW|—faw [значение]
—CWL|—cwl [значение]
—WTRS|—wtrs [значение]
—WTRL|—wtrl [значение]
—WR|—wr [значение]
—WRRD|—wrrd [значение]
—RDWR|—rdwr [значение]
—REF|—ref [значение]
—MRD|—mrd [значение]
—MOD|—mod [значение]
—PD|—pd [значение]
—CKSRE|—cksre [значение]
—CKSRX|—cksrx [значение]
—RFC|—rfc [значение]
Пример командной строки для использования утилиты для разгона памяти HBM2:
./amdmemtool -i 0,3,5 —faw 12 —RFC 208
Пример использования утилиты для разгона памяти GDDR5:
./amdmemtool -i 1,2,4 —RFC 43 —ras2ras 176
Перед первым запуском утилиты для оптимизации видеокарт с памятью GDDR5 нужно запустить программу-майнер, чтобы полностью загрузить видеокарту и перевести ее в состояние максимальной производительности, а затем запустить батник amdmemorytweak с параметром —current, чтобы узнать граничные значения таймингов видеопамяти. Видеокарты с памятью HBM2 этой процедуры не требуют.
Нужно учитывать ,что тайминг CL (Cas Latency) значительно влияет на стабильность, поэтому его уменьшение может уменьшить стабильность работы рига.
Какие особенности имеют модули памяти gddr6x?
Модули памяти GDDR6X являются разработкой фирмы Микрон, где работа над их выпуском началась в 2022 году. Они дают выигрыш в производительности не менее 30% от предыдущих поколений памяти:
FBGA-чипы GDDR6X работают под напряжением 1,35 и 1,25 вольт при температуре от 0 до 95 градусов. Они имеют размер, идентичный чипам GDDR6 (12х14х0,75 мм) и те же 180-контактов.
Таблица характеристик памяти GDDR6X производства Micron в сравнении с чипами предыдущих поколений:
Характеристика памяти | GDDR5 | GDDR5X | GDDR6 | GDDR6X |
---|---|---|---|---|
Плотность хранения данных | От 512Mb до 8Gb | 8Gb | 8Gb, 16Gb | 8Gb, 16Gb |
Напряжения VDD и VDDQ | 1.5V или 1.35V | 1.35V | 1.35/1.25V | 1.35V или 1.25V |
VPP | — | 1.8V | 1.8V | 1.8V |
Скорость передачи данных | до 8 Gb/s | до 12Gb/s | до 16 Gb/s | 19 и 21 Gb/s, >21 Gb/s |
Количество каналов | 1 | 1 | 2 | 2 |
Гранулярность доступа, байт | 32 | 64 2x 32 в псевдо 32B режиме | 2 канала x 32 | 2 канала x 32 |
Длина пакета данных | 8 | 16 / 8 | 16 | 8 в режиме PAM4 16 в режиме RDQS |
Кодирование сигнала | POD15/POD135 | POD135 | POD135/POD125 | PAM4 POD135/POD125 |
Корпус | BGA-170 14mm x 12mm 0.8mm ball | BGA-190 14mm x 12mm 0.65mm ball | BGA-180 14mm x 12mm 0.75mm 0.34 ball | BGA-180 14mm x 12mm 0.75mm 0.34 ball |
Ширина шины I/O | x32/x16 | x32/x16 | 2 канала x16/x8 | 2 канала x16/x8 |
Количество сигналов | 61 — 40 DQ, DBI, EDC — 15 CA — 6 CK, WCK | 61 — 40 DQ, DBI, EDC — 15 CA — 6 CK, WCK | 70 or 74 — 40 DQ, DBI, EDC — 24 CA — 6 or 10 CK, WCK | 70 or 74 — 40 DQ, DBI, EDC — 24 CA — 6 or 10 CK, WCK |
PLL, DCC | PLL | PLL | PLL, DCC | DCC |
CRC | CRC-8 | CRC-8 | 2x CRC-8 | 2x CRC-8 |
VREFD | External or internal per 2 bytes | Internal per byte | Internal per pin | Internal per pin 3 sub-receivers per pin |
Equalization | N/A | RX/TX | RX/TX | RX/TX |
VREFC | Наружная | Наружная или внутренняя | Наружная или внутренняя | Наружная или внутренняя |
Self refresh (SRF) | Да Temp. Controlled SRF | Да Temp. Controlled SRF Hibernate SRF | Да Temp. Controlled SRF Hibernate SRF VDDQ-off | Да Temp. Controlled SRF Hibernate SRF VDDQ-off |
Scan | SEN | IEEE 1149.1 (JTAG) | IEEE 1149.1 (JTAG) | IEEE 1149.1 (JTAG) |
В настоящее время выпускается два вида модулей памяти GDDR6X:
- MT61K256M32JE-19 – двухканальные модули x16/x8 GDDR6X SGRAM с быстродействием 19 Gb/s (есть 2-канальные 256 Meg x 16 I/O и2-канальные 512 Meg x 8 I/O);
- MT61K256M32JE-19 – модули быстродействием 21 Gb/s (на видеокартах будут доступны в 2021 году).
Каждый 8 гигабайтный чип содержит 16 внутренних банок сгруппированных по четыре и способен хранить 8,589,934,592 битов.
Маркировка модулей памяти GDDR6X фирмы Micron расшифровывается так:
Размеры и размещение контактов на микросхемах GDDR6X на примере спецификаций MT61K256M32:
Блок-схема работы чипов памяти GDDR6X:
Адресация памяти типа GDDR6X:
Типовые напряжения, на которых работают микросхемы памяти GDDR6X:
Максимальная рабочая температура полупроводниковых элементов памяти GDDR6X такая же, как и у GDDR5/GDDR5X – 100 градусов по Цельсию. Для справки далее приводятся максимальные рабочие температуры памяти различных типов.
Таблица максимальных температур на полупроводниковых элементах различных видов памяти (первая часть):
Таблица максимальных температур на полупроводниковых элементах различных видов памяти (вторая часть):
О хешрейте видеокарт nvidia geforce rtx 3070ti/3080ti при майнинге
Видеокарты Nvidia GeForce RTX 3070Ti и 3080 Ti выделяются в положительную сторону благодаря использованию высокопроизводительной VRAM GDDR6X-типа. Благодаря этому их производительность на алгоритмах, интенсивно использующих память большого объема, например, Ethash, должна быть значительно выше других видеокарт с памятью типа GDDR6 и тем более, GDDR5.
У видеокарт серии Ti исправлены недостатки, выявленные при производстве и эксплуатации обычных видеокарт RTX 3070 и 3080. Благодаря этому они должны быть более надежными и производительными.
На практике производительность RTX 3070Ti и 3080 Ti в майнинге не столь хороша, какой должна быть. Значительное влияние на производительность новых видеокарт влияют ограничения, накладываемые на майнинг со стороны компании Nvidia (hashrate limiter). Они касаются операций по работе с большими массивами данных, что сильно влияет на такие алгоритмы, как (хешрейт видеокарты Nvidia GeForce RTX 3080 Ti, в Mh/s):
- ethash (монеты ETH, ETC и т. д.) — 70 (должна выдавать порядка 110-120);
- autolykos2 (ERGO) — 124;
- kawpow и другие.
Для сравнения, GeForce RTX 3080, у которой в драйверах нет ограничений на майнинг, на алгоритме Ethash выдает более 90 Mh/s.
На алгоритмах, отличных от Ethash, видеокарты серии RTX 3000 работают не так уж плохо. Например, Nvidia GeForce RTX 3080 Ti на алгоритме MTP (монета FIRO) выдает более 5 Mh/s, на Octopus (монета CFX) — 97 Mh/s.
У Nvidia RTX 3070Ti картина также печальна, с той лишь разницей, что цифры по хешрейту для RTX 3080TI нужно разделить на два.
С уверенностью можно сказать, что после спада ажиотажа, связанного с ростом курса криптовалют в конце 2020 — начале 2021 года, эти ограничения будут сняты или взломаны.
Пока желающие эксплуатировать новейшие видеокарты Nvidia должны избегать майнинга на алгоритме Ethash, либо использовать взломанные или неофициальные драйвера. Например, драйвера Nvidia версии 470.05 для Windows не имеют антимайнинговых ограничений и успешно работают с видеокартами RTX3060.
Далее приводятся сравнительные характеристики видеокарт производства Nvidia и AMD.
Сравнительные характеристики технических характеристик видеокарт Nvidia GeForce RTX 3080/3080Ti, RTX 3070/3070Ti, RTX 3090 и AMD Radeon RX 6900XT:
Параметр | Nvidia | Nvidia | Nvidia | AMD |
Дата начала производства | 01.09.2020 | 01.09.2020/ | 01.09.2020/ | 28.10.2020 |
Графический процессор | GA102-300-A1 | GA102-200-KD-A1/ GA102-225-A1 | GA104-300-A1/ | Navi 21 XTX |
Архитектура | Ampere | Ampere | Ampere | RDNA 2.0 |
Технический процесс, нм | 8 | 8 | 8 | 7 |
Количество транзисторов, млрд | 28.3 | 28.3 | 17.4 | 26.8 |
Площадь кристалла, mm² | 628 | 628 | 392 | 520 |
Compute units/ | 82 | 68/ | 46/ | 80 |
Количество ядер | 10496 | 8704/ | 5888/ | 5120 |
Количество блоков TMU/ROP | 328/112 | 272/96 | 184/96 | 320/128 |
Частота работы GPU, МГц | 1395-1695 | 1440-1710/ | 1500-1725 | 1825-2250 |
Производительность FP32, TFLOPS/ | 35.58/556 | 29.77/465.1 34.1/532.8 | 20.31/317.4 21.75/339.8 | 23.04/1440 |
Объем видеопамяти, GB | 24 | 10/ | 8 | 16 |
Тип видеопамяти | GDDR6X | GDDR6X | GDDR6/ | GDDR6 |
Тактовая частота памяти, МГц/ | 1219/19.5 | 1188/19 | 1750/14 | 2000/16 |
Разрядность шины памяти, бит | 384 | 320/ | 256 | 256 |
Кеш L2/L3, MB | 6/- | 5/- | 4/- | 4/128 |
Полоса пропускания памяти, GB/s | 936.2 | 760.3/ | 448/ | 512 |
Поддержка CUDA/ | 8.6/3.0 | 8.6/3.0 | 8.6/3.0 | -/2.1 |
Теоретический хешрейт на Ethash, Mh/s (согласно VRAM) | 117 | 95/ | 56/ | 64 |
Потребление | 350 | 320/ | 220/ | 300 |
Энергоэффективность, Mh/s на ватт | 0.33 | 0.3/0.33 | 0.25/0.26 | 0.21 |
Примечание: производительность на алгоритме Ethash для видеокарт Nvidia указана без учета ограничений на производительность при майнинге, введенных этой компанией. На практике хешрейт новых видеокарт трехтысячной серии на алгоритме Ethash искусственно занижен на 40-50%. Например, с учетом ограничений в драйвере, хешрейт на Ethash у Nvidia GeForce RTX 3080Ti составляет около 70-80 Mh/s.
Энергоэффективность GeForce RTX 3080Ti и RTX 3090 при майнинге на алгоритме Ethash (0.33 Mh/ватт без учета антимайнинговых ограничений) должна быть одной из лучших среди видеокарт, хотя это и не позволяет им соревноваться с современными ASIC-ами, например, ASIC Miner A11 ETH Master (0.8 Mh/s на 1 Ватт) или ASIC Linzhi Phoenix (0.86 Mh/ватт).
AMD Radeon RX 6900, видеокарта-лидер из «стана красных» имеет значительно меньшую теоретическую производительность и энергоэффективность (при стоковых значениях частоты и вольтажа) при проведении вычислений на памятезависмых алгоритмах в сравнении с RTX 3080Ti/3090 и даже 3070Ti. Хешрейт AMD Radeon RX 6900XT на алгоритме Ethash сравним с разогнанной GeForce RTX 3070.
Устройство и ремонт кулера пк
Для того чтобы разобрать вентилятор, нужно снять наклеенный шильдик со стороны проводов, открыв доступ к резиновой заглушке, которую и извлекаем.
Подцепим пластмассовое или металлическое полукольцо любым предметом с острым концом (нож канцелярский, часовая отвёртка с плоским шлицем и т.п.) и снимаем с вала. Взору открывается моторчик, работающий от постоянного тока по бесщёточному принципу. На пластиковой основе ротора с крыльчаткой по кругу вокруг вала закреплен цельнометаллический магнит, на статоре — магнитопровод на медной катушке.
Затем почистите отверстие под ось и капните туда немного машинного масла, соберите обратно, поставьте заглушку (чтоб пыль не забивалась) и пользуйтесь уже гораздо более тихим вентилятором дальше.
У всех таких вентиляторов бесколлекторный механизм вращения: это надёжность, экономичность, бесшумность и возможность регулировки оборотов.
У современных кулеров разъёмы имеют гораздо меньший размер, где первый контакт пронумерован и является «минусом», второй «плюсом», третий передаёт данные о текущей скорости вращения крыльчатки, а четвёртый управляет скоростью вращения.
Вы только что купили новенький кулер Thermaltake, но вам не нравится, что после его установки ваш компьютер стал шуметь, как пылесос? Вы хотите поставить Blue Orb на видеокарту, но он слишком громкий для вас? И вам плевать на охлаждение — вам не нужен разгон, вам нужна тишина?
Итак, для начала. Все продающиеся сейчас кулеры для процессоров работают от напряжения 12 Вольт. Вентиляторы при этом напряжении выходят на заявленную скорость и работают в соответствии с заявленными характеристиками. И производительность, и уровень шума вентилятора пишутся для номинального напряжения.
В вентиляторах используются микродвигатели, работающие на постоянном токе. Частота их вращения напрямую зависит от подаваемого напряжения. Следовательно, если мы увеличим напряжение на вентиляторе, он начнёт вращаться быстрее. Если уменьшим — медленнее.
В статье «Новое поколение кулеров» я упоминал способы подключения вентиляторов. Давайте вернёмся на два года назад и посмотрим на них ещё раз:
Как подключаются вентиляторы — вентиляторы для компьютерных кулеров имеют два типа подключения — через PC plug коннектор и через MOLEX коннектор.
PC plug коннектор представляет собой стандартный четырёхпроводный коннектор, используемый в большинстве компьютерных устройств. Преимущества его в том, что его использование позволяет подключить практически неограниченное число вентиляторов (при Pass-through подключении).
Также при его использовании можно регулировать потребляемую вентилятором мощность. PC plug имеет четыре провода — два провода заземления (чёрных), провод с потенциалом 5 В и провод с потенциалом 12 В. Если ваш вентилятор раздражает вас своим шумом, то можно уменьшить подаваемое ему напряжения до 7В, или 5В.
MOLEX коннектор — более новый. Он позволяет подключать вентиляторы к материнской плате, автоматически управлять потребляемой мощностью вентилятора и отслеживать частоту вращения вентилятора. Недостатки этого коннектора — ограниченное количество подключаемых вентиляторов, зависящее от материнской платы, невозможность вручную уменьшить потребляемую мощность.
Преимущества в том, что при достаточном охлаждении материнская плата понижает напряжение на вентилятор, он потребляет меньше мощности и, как следствие, меньше шумит. Также с помощью MOLEX коннектора есть возможность следить за частотой вращения вентилятора, но при условии, что в вентиляторе установлен датчик Холла.
Сегодня 95% всех продаваемых кулеров подключаются через Molex коннектор. А так как на материнской плате в Molex коннекторах присутствует только плюс и земля (сигнал мы не считаем), то самым простым способом до недавнего времени считалась запайка дополнительного сопротивления в провод, питающий вентилятор, то есть, в центральный провод.
Сделать это не сложно — достаточно подобрать нужное сопротивление для вентилятора мощностью от двух до восьми ватт и подключить его в разрез среднего провода. Мы видели такое в промышленном исполнении на кулере Zalman CNPS 5000 . Правда, здесь сопротивления включались в разрез среднего провода на специальных переходниках.
При таком регулировании можно добиться совсем разных напряжений. Но такой способ имеет ряд недостатков.
Сопротивление сильно греется при работе вентиляторов
Модифицированный таким образом вентилятор теряет гарантию (если она была)
Надо искать сопротивление
Надо использовать паяльник
Конечно же, настоящие технари выбрали бы именно этот способ, когда можно поставить реостат (резистор с изменяемым сопротивлением), но мы знаем способ лучше, легче и быстрее.
Итак, как вы могли видеть выше, между крайними проводами PCPlug коннектора всегда поддерживается напряжение 7 Вольт. Именно оно нам и нужно. Оно почти в два раза меньше, чем 12В, а значит кулер будет шуметь намного меньше, правда и охлаждая при этом слабее.
Всё, что нам надо — это чтобы в комплекте к кулеру шёл переходник PCPlug-Molex. Эти переходники сегодня поставляются со всеми новыми кулерами Thermaltake, со всеми кулерами на видеокарты и системные чипы, если охладители идут в Retail, а не OEM. А так как все такие кулеры поставляются именно Retail, то вы вправе потребовать переходник с фирмы, продавшей вам компьютер с установленным, скажем, Dragon Orb 3.
Посмотрите на переходник. Вот он, перед нами. Он представляет собой последовательное Pass-Through соединение двух PCPlug коннекторов, чтобы при подсоединении кулера не потерять PCPlug розетку. К Male-коннектору PCPlug (со штырьками) параллельно двумя проводками подсоединён Molex коннектор (тоже со штырьками).
Красный провод Molex коннектора подсоединён к жёлтому на PCPlug, а чёрный — к чёрному. Таким образом, с 12В контакта PCPlug потенциал 12В передаётся на средний провод Molex-а. Второй провод (чёрный) на Molex-коннекторе — это земля. Потенциал на этом проводе равен 0 В.
Соответственно, напряжение между двумя проводами (разность потенциалов) равно 12В. Именно напряжение определяет скорость вращения вентилятора. Поэтому чтобы снизить разность потенциалов между двумя проводами, мы подадим на «землю» Molex-а положительное напряжение.
Для этого чёрный провод Molex-а надо подсоединить к красному проводу на PCPlug. В результате, на одном проводе будет 12В, на другом — 5В, в результате разность потенциалов составит 7В, а так как на жёлтом проводе потенциал останется большим, направление вращения вентилятора не изменится.
Как же нам сделать это? Довольно просто. Вся операция займёт у вас не более пяти минут. Всё, что надо иметь для этой операции — это тонкую отвёрточку, или пинцет также, возможно понадобятся пассатижи, но это по желанию.
Берём в руки ту часть переходника, к которой подключены провода от Molex-а. В этом PCPlug коннекторе мы видим контакты в форме штырьков. Это вход переходника. Именно этой стороной переходник подключается к блоку питания.
Как вы видите, чтобы штырьки контактов не вывалились из разъёма, они держатся двумя «крылышками». Сами штырьки свёрнуты из алюминиевой пластинки и внутри пустые. С двух сторон в них сделаны специальные крылышки, отогнутые ёлочкой, чтобы они позволяли вставить штырёк в разъём, но не вытащить его оттуда.
Нам надо тоненьким пинцетом, или отвёрточкой отогнуть внутрь эти крылышки, чтобы штырьки можно было вытащить из разъёма. Нам надо поменять местами чёрный провод, который рядом с жёлтым, к которому подходит чёрный провод от Molex-а и крайний красный провод.
После того, как вы вытащите эти два контакта, отогните крылышки обратно и вставьте красный провод на место чёрного, а чёрный — на место красного. Убедитесь, что контакты не выскакивают обратно. Всё! Теперь на Molex-е напряжение — 7 Вольт.
Как видите, всё очень просто. Вы можете на этом остановиться, но ведь мы перепутали провода на второй PCPlug розетке переходника. Если розеток в вашем блоке питания достаточно, то её вообще можно отрезать, или написать на ней фломастером, что она не используется и жить спокойно.
Вообще, так как между жёлтым и чёрным контактом у нас 7 Вольт, то мы можем к этому переходнику и дальше подключить обычный, не переделанный PCPlug-Molex переходник и на его Molex разъёме уже будут готовы 7 Вольт. Но мы пойдём другим путём и доведём дело до конца.
Сзади PCPlug розетка имеет другие контакты в виде трубочек. Они также согнуты из алюминия и также имеют крылышки, которые их удерживают на месте. Отогнуть их отвёрткой, или пинцетом будет сложно — вы их погнёте и не сможете использовать. Я переделал десятка два-три таких переходников и понял, что самый простой способ — это вырвать чёрный и красный провод вместе с контактом из розетки пассатижами.
Тут удобно упереться пассатижами о заднюю стенку розетки, ухватить за провод и повернуть пассатижи. Ни разу у меня провод не отрывался от контактов. Обычно крылышки сворачиваются в другую сторону и контакт легко выходит к вам в руки. Теперь надо тоненькой отвёрткой вернуть крылышки в исходное положение — распрямить их и поставить ёлочкой.
В результате вы получите контакты, как показано на фотографии выше. Вставьте их так, чтобы провода не оказались перекручены. Красный — рядом с жёлтым, а чёрный — с краю.
Теперь наш переходник готов к использованию. Вы можете включать в него кулер, а с другой стороны даже винчестер. Провода не перекручены, полярность соблюдена. Точно таким же способом можно изменить напряжение кулера, который подключается через PCPlug, а не через Molex.
В свои последние модели Thermaltake стала вкладывать более новые переходники PCPlug-Molex. Если вы купили Crystal Orb, Volcano 7, или Tiger, то у вас уже будет более новый переходник, без соединительных проводов между двумя PCPlug разъёмами.
Если у вас такой новый переходник — не бойтесь, мы и его переделаем. Я тоже не сразу понял, как он работает. Отличия этого переходника в том, что два Pass-Thru PCPlug коннектора выполнены в одном корпусе и между ними нет проводов. Конечно, в компьютере это удобнее — меньше проводов.
Первым делом, мы видим, что провода к Molex-у отходят от середины переходника. Корпус переходника сделан таким образом, что сверху два крайних его контакта закрываются специальной крышечкой. Чтобы добраться до этих контактов, мы открываем крышечку, поддевая её с середины корпуса.
По аналогии со старым переходником, нам надо вытащить чёрный провод, второй контакт справа и поставить его в самую крайнюю слева позицию. Схема извлечения контактов точно такая же, как и в обычном переходнике: тонкой отвёрткой, или пинцетом сгибаем крылышки со стороны штырьков и выталкиваем контакт наружу. Так мы поступаем с крайним слева и вторым справа контактами.
В результате, мы видим перед собой контакт нового образца. С одной его стороны — штырёк, с другой — трубочка. С двух сторон имеются удерживающие крылышки, чтобы контакт не вываливался. Просто так вставить провод в левую позицию у нас не получится — провод упрётся в корпус переходника.
Поэтому отвёрткой мы разгибаем вторую часть контакта с проводом, трубочку. Надо аккуратно разогнуть её и ещё две лапки прямо возле того места, где провод припаян к металлу. После этого мы прокладываем провод внутрь трубочки и загибаем её обратно, как показано на фотографии снизу.
Делать это надо как можно плотнее, чтобы перегиб провода посередине контакта был как можно меньше. После того, как мы сделали это, ещё раз убеждаемся, что крылышки контактов расправлены и вставляем штыревой контакт в крайнюю левую позицию.
Теперь у нас получилось то, что вы видите на фотографии сверху. Из одного трубчатого контакта (если можно так выразиться) отходит провод, поэтому вторая сторона переходника теперь недоступна для использования. Мы закрываем пластмассовую крышечку и модифицированный переходник на 7 Вольт готов!
Можем смело подключать к нему вентилятор и наслаждаться тишиной в компьютере.
5 Вольт
Точно по такой же схеме мы можем переделать переходник и на напряжение 5 В, поменяв жёлтый провод с красным. Почему бы так не сделать? Дело в том, что вентиляторы имеют стартовое напряжение — такое минимальное напряжение, при котором вентилятор стартует, заводится.
Если стартовое напряжение будет меньше, вентилятор будет греться, но не заработает. Для современных вентиляторов размером 60x60x25 это напряжение равно 9 В. При 7 В они ещё могут стартовать, хотя я встречал и такие, что отказывались заводиться. Ну а кроме того, при 5 В кулер уже будет очень плохо охлаждать, и смысла реализовать такую конверсию нет.
Всегда старайтесь покупать кулеры с подобными переходниками. Менее чем за пять минут, в офисных условиях, без помощи паяльника, или специальных инструментов, мы смогли понизить напряжение на вентилятор кулера, избавившись от лишнего шума. Естественно, при пониженном напряжении вентилятор гонит меньше воздуха и хуже охлаждает процессор, так что надо первое время после такой конверсии посматривать за температурой процессора.
Преимущества понижения напряжения именно таким способом налицо: вы не теряете гарантию на кулер, переходник, сделанный таким образом, получается очень надёжным, он не греется и не перегорает. Ну и, конечно, простота. Если у вас нет отвёртки под рукой, можно воспользоваться булавкой, или заколкой.
Сделав таким образом один переходник на семь Вольт, вы сможете оставить его на все свои следующие кулеры. Вы можете оставить провода перекрещенными, чтобы на выходе в PCPlug также было семь Вольт. Тогда все подключенные дальше кулеры будут без модификации переходников работать от напряжения 7 В и меньше шуметь.
Напоследок я хочу сказать, что не несу ответственности за все ваши ошибки, совершённые во время модификации и за все последствия таких ошибок. Этот материал — лишь теоретическая основа, а не руководство к действию. Если у вас возникнут вопросы — задавайте их не мне, а в форуме на нашем сайте.