NVIDIA-ның Groq-пен серіктестігі қазір ресімделуде, өйткені Дженсен Rubin бағанында Groq-дан үшінші буын LPU блоктары бар гибридті есептеу модулін ұсынады.NVIDIA-ның groq идеясы-инференстегі бәсекелестікті бұзуға үміттеніп, "жоғары жылдамдықты" жұмыс жүктемелерін нысанаға алу
NVIDIA Groq-пен не істейтіні туралы пікірталас біраз уақытқа созылды және біз дамудың негізгі көшбасшылығын сақтадық. GTC 2026 — да NVIDIA Жаңа vera Rubin-groq 3 LPX гибридті есептеу модулін ұсынды, оған сегіз "жарияланбаған" Groq3 блоктары кіреді, біз оларды әрі қарай талқылаймыз. NVIDIA мәліметтері бойынша, LPX және Rubin бірге бұрын-соңды болмаған инференс өнімділігін қамтамасыз етеді, бұл инференстің мегаватт сыйымдылығының 35 есе өсуін қамтамасыз етеді, сондықтан Groq шешімі NVIDIA үшін инференс нарығын ашудың кілті болды.

Жеке есептеу модуліне келетін болсақ, біз 128 ГБ ішкі SRAM және 640 ТБ/с масштабтау өткізу қабілеттілігін әкелетін 256 LPU блогы бар тіректі қарастырамыз. Бұл NVIDIA-ның cerebras және inference бәсекелестерінің не істеп жатқанына жауабы және шын мәнінде Rubin GPU-ны LPU-мен біріктіре отырып, NVIDIA компанияға "олар бірінші емес"нарықта бәсекеге қабілетті болуға мүмкіндік беретін алдын ала толтыру сатысында да, inference декодтау сатысында да нысанаға алады.
Жеке groq3 чипі үшін сіз 500 МБ SRAM, 150 ТБ/с SRAM өткізу қабілеттілігін және 1,2 петафлопты (FP8) қарайсыз. Rubin мен Groq LPX модулін біріктірген кезде, NVIDIA бас директоры AI инференс үшін жалпы есептеулер 315 петафлоптарға дейін жетеді дейді және міне, модульдің ішкі көрінісі:
Триллиондаған параметрлері мен миллион таңбалауыш контексті бар модельдер үшін оңтайландырылған LPX архитектурасы қуат, жад және есептеу тиімділігін арттыру үшін Vera Rubin-мен біріктірілген. Бір ватт үшін қосымша өткізу қабілеттілігі және токен өнімділігі триллиондаған параметрлері мен миллион контексті бар Ультра Премиум инференцияның жаңа деңгейін ашады, бұл барлық AI провайдерлері үшін кіріс мүмкіндіктерін кеңейтеді.
Groq-тің LPU блоктары желілердегі Mellanox рөліне ұқсас рөл атқарады және бұл гибридті архитектура NVIDIA-ға кідірістерге сезімтал жұмыс жүктемелерін бастайды. Агенттік AI сала үшін келесі "сыну нүктесіне" айналғандықтан, NVIDIA үшін есептеу талаптарын қанағаттандыру өте маңызды, сондықтан groq-пен серіктестік Team Green үшін маңызды уақытта келді.