NVIDIA представила новый суперчип Blackwell, который демонстрирует значительное преимущество по сравнению с предыдущим поколением H100. Тесты, проведенные CoreWeave на модели DeepSeek R1, показали, что для достижения 6-кратного увеличения производительности требуется всего 4 графических процессора GB300 вместо 16 H100. Это сокращение нагрузки на тензорный параллелизм позволяет улучшить межпроцессорное взаимодействие и повысить общую пропускную способность.
Таким образом, новый чип позволяет компаниям более эффективно масштабировать AI-операции и достигать высокой производительности даже с ограниченными ресурсами.
Первоисточник: Sarfraz Khan