Бас директор Сатя Наделлада электр қуатының жетіспеушілігіне байланысты "қоймада чиптер үйіндісі" бар болса да, Microsoft корпорациясы жаңа буын ai үшін өзінің кремнийін жариялады: Maia 200 үдеткіші, бұлтта үлкен модельдерді тезірек және арзан іске қосу үшін жасалған, қазіргі Azure-мен салыстырғанда. Бұл үшінші тараптың ai чиптеріне тәуелділікті төмендетудің кең стратегиясының бөлігі (мысалы, Nvidia-да) аппараттық құралды дамытудың үлкен көлемі арқылы.
Негізінде, Maia 200-Бұл Microsoft корпорациясының кремнийді әзірлеушілер тобының AI чипі, ол үлкен тілдік модельдерде және басқа генеративті AI тапсырмаларында инференцияны орындау үшін арнайы жасалған. Ертедегі эксперимент болған бірінші Maia (Maia 100) - ден айырмашылығы, Microsoft бұл модельді қарсыластарымен тікелей табалдырықтан салыстырады.

Maia 200 инференс тапсырмалары үшін әсерлі көрсеткіштерді көрсетеді. Ол 140 миллиардтан астам транзисторлары бар 3 нм TSMC процесінде жасалған және fp8 және FP4 төмен дәлдіктегі тензорлық есептеулерді қолдайды, бұл FP4-те шамамен 10 петафлоп және FP8-де шамамен 5 петафлоп деп айтылады. Бұл қазіргі заманғы үлкен модельдер жылдамдық пен тиімділік үшін жұмыс істейтін форматтар. Майкрософттың айтуынша, чипте ~7 ТБ/с өткізу қабілеті бар 216 ГБ HBM3e жады бар, сонымен қатар есептеу блоктарына жақын деректерді сақтау арқылы өнімділікті арттыру үшін 272 МБ Ішкі SRAM бар.

Azure Maia 200 олардың саябағындағы алдыңғы буын жабдықтарымен салыстырғанда бір долларға шамамен 30% жақсы өнімділікті қамтамасыз етеді деп мәлімдейді. Жүйелік деңгейде Maia 200 үлкен кластерлерде үлкен модельдердің тиімділігін сақтау үшін жоғары өткізу қабілеттілігі бар Ethernet негізіндегі масштабтау фабрикасын және пайдаланушының жадының орналасуын/деректерді жылжытуды қолданады.
Майкрософт Maia 200-ді басқа бұлтты кремнийге қарсы қояды; атап айтқанда, Amazon Trainium 3-ке қарсы, онымен салыстырғанда Maia 200 FP4 өнімділігін шамамен 3 есе арттырады және Google TPU v7, мұнда Fp8 Maia өнімділігі бәсекеге қабілетті немесе одан жоғары болып көрінеді. Бұл AWS және Google Nvidia-ға қарсы тұру үшін алға тартатын ұрпақ бәсекелестері және Microsoft өзінің пресс-релизінде Nvidia GPU-мен тікелей салыстыруды көрсетпесе де, басты мақсат айқын: NVIDIA-ға ұзақ мерзімді тәуелділікті төмендету.
Әрине, Nvidia-ның Blackwell отбасы аралас AI тапсырмалары үшін алтын стандарт болып қала береді (әсіресе оқыту + инференс), бірақ бұлт нарығы бірнеше ойыншылар үшін жеткілікті үлкен, әсіресе қазір. Microsoft корпорациясының іске қосылуы-бұл кең тенденцияның бөлігі.
Майкрософт Maia 200 қазірдің өзінде Azure us Central (Айова) аймағында қосымша аймақтарға кеңейту жоспарларымен орналастырылғанын айтады және мегакорпорация Pytorch қолдауымен Maia SDK, TRITON компилятор құралдары және әзірлеушілерге модельдерді орнатуды жеңілдету үшін оңтайландырылған ядроларды ұсынады. Әрине, егер сіз онымен жұмыс жасағыңыз келсе, Azure-ге кіруіңіз керек, себебі ол жеке өнім ретінде сатылмайды; ол тек Azure инфрақұрылымына арналған.
The Information мәліметтері бойынша, Microsoft корпорациясының жаңа AI чипі (ішкі Код атауы Braga) бастапқыда 2025 жылдың ортасында күтілді, бірақ OpenAI талап еткен дизайн өзгерістерінен, модельдеудегі тұрақтылық мәселелерінен және чип жасаушылар арасындағы айналымның жоғарылауынан кейін 2026 жылға дейін кешіктірілді. Мұндай кідірістер жеке кремний әлемінде ерекше емес; бұл құбыжықтарды жобалау, модельдеу және шығару өте қиын. Олар шынымен де Microsoft корпорациясы бұлтқа негізделген ai кремнийінің кеңірек жарысын қуып жетіп, одан алда жүгірмейтінін білдіреді. Maia 200 алға жасалған маңызды қадам ба, жоқ па, соны жарияламас бұрын тәуелсіз эталондарды күтуіміз керек.Бастапқы Дереккөз: Zak Killian