NVIDIA компаниясының жаңа буын GPU Feynman 2028 жылға қарай Groq тен LPU блоктарын ала алады

NVIDIA Feynman чиптерінің жаңа буынымен инференс сегментінде үстемдік етуді жоспарлап отыр, өйткені компания lpu блоктарын(тілдік модельдердің жауабын найзағай жылдамдығына айналдыратын арнайы микрочип) архитектураға біріктіре алады.

Groq компаниясының LPU блоктарының зияткерлік меншігіне арналған team Green Лицензиялық Келісімі сатып алу ауқымына және онымен байланысты кіріс көрсеткіштеріне қараған кезде қалыпты оқиға болып көрінуі мүмкін, бірақ шын мәнінде NVIDIA lpu арқылы inference сегментінде жетекші орынға ие болуға ниетті және біз оны кеңейтілген материалда егжей-тегжейлі талқыладық. NVIDIA LPU-ны қалай біріктіруді жоспарлап отырғанына келетін болсақ, әртүрлі болжамдар пайда болды; дегенмен, GPU AGF сарапшысының пікіріне сүйене отырып, LPU блоктарын TSMC гибридті қосылу технологиясын қолдана отырып, жаңа буын GPU Feynman-ға орналастыруға болатын сияқты.

Сарапшы 3D V-Cache плиткаларын негізгі есептеу кристалына біріктіру үшін TSMC-тің SOIC гибридті қосылу технологиясын қолдана отырып, AMD X3D процессорларымен не істегенін еске түсіруі мүмкін деп санайды. AGF SRAM-ны монолитті Кристалл ретінде біріктіру Feynman GPU үшін дұрыс қадам болмауы мүмкін деп санайды, өйткені SRAM масштабтау шектеулі және оны озық процестерде өндіру қымбат кремнийді ысырап етеді және пластина аймағын пайдалану құнының күрт өсуіне әкеледі. Оның орнына, AGF NVIDIA Feynman есептеу кристалының үстіне LPU блоктарын орналастырады деп санайды.

Енді бұл тәсіл A16 (1,6 нм) сияқты чиптер есептеу блоктары (тензор ядролары, басқару логикасы және т.б.) бар негізгі Feynman кристалы үшін пайдаланылатынын ескерсек, ақылға қонымды болып көрінеді, ал жеке lpu кристалдарында үлкен SRAM банкалары болады. Сонымен қатар, бұл кристалдарды қосу үшін TSMC гибридті қосылым технологиясы өте маңызды болады, өйткені ол сыртқы жадпен салыстырғанда кең интерфейсті және бір бит үшін аз қуат тұтынуды қамтамасыз етеді. Сонымен қатар, A16 артқы қуатпен жабдықталғандықтан, алдыңғы жағы төмен кідірісті декодтауды қамтамасыз ететін тік SRAM қосылымдары үшін босатылады.

Алайда, бұл әдісті қолдану кезінде NVIDIA жылу шектеулерін қалай басқаратыны туралы алаңдаушылық бар, өйткені кристалдарды жоғары тығыздықтағы есептеу процесіне орналастыру қазірдің өзінде қиын міндет болып табылады. Тұрақты өткізу қабілеттілігіне бағытталған LPU көмегімен ол кедергілерді тудыруы мүмкін. Ең бастысы, орындау деңгейіндегі мәселелер де осы тәсілмен айтарлықтай артады, өйткені LPU белгіленген орындау тәртібіне шоғырланған, бұл, әрине, детерминизм мен икемділік арасындағы қайшылықты тудырады.

NVIDIA аппараттық деңгейдегі шектеулерді шеше алса да, басты мәселе-CUDA lpu стилінде орындалған кезде өзін қалай ұстайды, өйткені бұл жадты нақты орналастыруды қажет етеді, ал CUDA ядролары аппараттық құралдарды абстракциялауға арналған. SRAM -. AI архитектурасына біріктіру Team Green үшін оңай жұмыс болмайды, өйткені LPU-GPU орталарын жақсы оңтайландыруды қамтамасыз ету үшін инженерлік ғажайып қажет болады. Дегенмен, бұл NVIDIA инфернес сегментінде көшбасшы болғысы келсе, төлеуге дайын баға болуы мүмкін.

Бастапқы Көзі: Muhammad Zuhair