Rubin + Helios: Нови GPU платформи от NVIDIA и AMD
В недалечното минало нова GPU означаваше по-бърза карта и по-шумни вентилатори. През 2026 г. истинската драма около GPU се разиграва в центровете за данни: редове от шкафове, сериозен план за охлаждане и захранващи кабели, достатъчно дебели, за да приличат на такива за подстанция. Там пристигат платформата Rubin GPU на NVIDIA и AI платформата в мащаб на шкаф Helios на AMD — две имена, които звучат като космически проекти, но всъщност са системни дизайни за изграждане и работа на AI в огромен мащаб.
И двете компании прокарват една и съща идея: един чип вече не е достатъчен. Съвременната AI система се нуждае от GPU, партньор CPU, бързи връзки между GPU в рамките на шкафа, бърза мрежа между шкафове и софтуер, който държи всичко натоварено с месеци. NVIDIA нарича това екстремно “съвместно проектиране” на ниво шкаф. AMD представя Helios като отворена, съгласувана с OCP шкафова архитектура, изградена с партньори.
Защо “GPU платформи” заменят “само GPU”
Най-големите днешни AI модели удрят граници, които не се решават просто с “още ядра”. Три ограничения се появяват отново и отново:
1) Паметта е ключова. Обучението и обслужването на модерни модели изискват огромен капацитет и пропускателна способност на паметта. Затова HBM (памет с висока пропускателна способност) става все по-важна.
2) Комуникацията определя скоростта. Много от текущите натоварвания, особено Mixture-of-Experts (MoE) моделите, зависят от това GPU-тата да си общуват бързо и предсказуемо. MoE моделите “маршрутират” токени към различни експерти. Това маршрутизиране създава много трафик GPU-към-GPU. Ако интерконектът е слаб, скъпите GPU чакат бездействащи.
3) Важни са цената на токен и енергията. Инференцията експлодира. Въпросът вече не е “Колко бърза е една GPU?”, а “Колко полезни токени получавам на ват и на евро?” Платформа, която понижава цената на токен, може да промени цените в облака, избора на размер на моделите и дори продуктовата стратегия.
Затова и NVIDIA, и AMD продават системи, при които един шкаф действа като един гигантски компютър. “Платформата” вече включва изчислителните чипове плюс фабрик (scale-up в шкафа и scale-out между шкафове), плюс функции за сигурност и надеждност, които поддържат машината в работа.
Затова Rubin и Helios се усещат различно от по-старите анонси. Те приличат по-малко на “нови GPU карти” и повече на “нови градивни блокове за центрове за данни”.
Платформата NVIDIA Rubin GPU 2026: спецификации, срокове и ключови функции
NVIDIA позиционира Rubin като наследник на Blackwell, изграден около системи в мащаб на шкаф като Vera Rubin NVL72 (и по-малки HGX системи). NVIDIA описва Rubin като платформа от шест чипа, проектирани заедно на ниво шкаф: CPU Vera, GPU Rubin, комутатор NVLink 6, ConnectX-9 SuperNIC, BlueField-4 DPU и комутатори Spectrum Ethernet.
Този списък с “шест чипа” не е украса. NVIDIA казва: шкафът е продуктът. GPU е звездата, но поддържащият състав върши трудната работа да я захранва с данни, да мести резултатите и да пази системата сигурна.
Голямото обещание на Rubin: по-ниска цена на токен, особено за MoE и “разсъждаващ ИИ”
NVIDIA казва, че Rubin е насочен към агентен ИИ, напреднало разсъждение и голямомащабна MoE инференция. В пусковите послания NVIDIA твърди, че Rubin може да осигури до 10 пъти по-ниска цена на инференция на токен спрямо Blackwell и може да обучава определени MoE модели с 4 пъти по-малко GPU от предишната платформа.
Това са големи твърдения и резултатите в реалния свят ще зависят от модела и софтуера. Посоката обаче е ясна: Rubin е проектиран да направи целия шкаф по-ефективен, а не само да спечели единичен бенчмарк.
Transformer Engine и NVFP4: търсене на ефективност без загуба на точност
На страницата за платформата Rubin NVIDIA акцентира нов Transformer Engine с хардуерно ускорена адаптивна компресия за повишаване на производителността при NVFP4 при запазване на точността. NVIDIA също заявява, че Rubin може да достигне до 50 петаFLOPS NVFP4 инференция.
Защо фокус върху формати като FP4? Защото инференцията често е ограничена от икономиката. Ако можете да намалите изчислителната и паметната цена на токен, можете да обслужвате повече потребители, да пускате по-големи контекстни прозорци или да държите ниска латентност без да купувате още един шкаф.
Scale-out мрежа: когато един шкаф не е достатъчен
Един шкаф може да е мощен, но големите AI клъстери трябва да свързват много шкафове. В презентацията на NVIDIA на CES стекът на платформата Rubin включва Spectrum-X Ethernet Photonics за scale-out свързаност, плюс ConnectX-9 и BlueField-4.
Това сочи ключова тенденция: мрежовата производителност и латентност вече са част от историята на GPU платформата. Прехвърлянето на данни между шкафове може да струва толкова (време и енергия), колкото и самото изчисление.
График и сигнали за приемане
На CES 2026 NVIDIA каза, че Rubin е в пълно производство, като партньорски продукти се очакват през втората половина на 2026 г.
Reuters съобщи също, че многогодишната сделка на NVIDIA за доставки към Meta включва Blackwell и бъдещи Rubin AI чипове, плюс Grace и Vera CPU.
Когато хиперскейлъри планират около платформа, обикновено значи, че платформата ще бъде реална — и скоро.
Платформата AMD Helios за AI в мащаб на шкаф: MI450/MI455X, UALink и график
Helios е отговорът на AMD за AI в мащаб на шкаф, но AMD я предлага с различен стил. AMD представя Helios като отворен, съгласуван с OCP шкафов дизайн, базиран на спецификации, подадени от Meta към Open Compute Project. AMD казва, че Helios се пуска като референтен дизайн към OEM/ODM партньори, с масово внедряване, очаквано през 2026 г.
С други думи: Helios е предназначен да бъде копиран, адаптиран и изграден от много системни производители — не само като един строго контролиран стек.
Helios в реалния свят: внедряването при Meta и мащаб в гигавати
На 24 февруари 2026 г. AMD и Meta обявиха окончателно партньорство за внедряване на до 6 гигавата AMD Instinct GPU през няколко поколения. AMD каза, че доставките за първото внедряване от 1 гигават се очаква да започнат през втората половина на 2026 г., задвижвано от персонализиран Instinct GPU на базата на архитектурата MI450 и 6-то поколение EPYC “Venice” CPU, работещи с ROCm, изградено върху Helios.
“Внедряване на GPU в мащаб гигавати” ви подсказва, че този пазар е напуснал хоби фазата.
Отвореност и интерконект: UALink, плюс “ранните стъпки”
Система в мащаб на шкаф е толкова добра, колкото и нейният фабрик за мащабиране в рамките на шкафа. Helios е обвързан с идеята за отворени интерконекти като UALink, но публикациите подсказват, че ранните системи Helios може първо да използват UALink върху Ethernet, а нативният UALink да дойде по-късно.
За купувачите отворените връзки могат да намалят зависимостта от един доставчик. За AMD това е голяма екосистемна задача: хардуерът, комутацията и софтуерът трябва да узреят едновременно.
Какво знаем за плътността на шкафа и целите за производителност
Независими репортажи описват Helios като много плътен шкафов дизайн. Tom’s Hardware съобщава, че шкафовете Helios могат да поберат 72 ускорителя Instinct MI455X с около 31 TB HBM4, целящи около 2.9 FP4 exaFLOPS за инференция и 1.4 FP8 exaFLOPS за обучение (с бележката за UALink върху Ethernet в ранните машини).
The Next Platform също е съобщавал за конфигурации на шкафове Helios и стойности за пропускателна способност в голям мащаб.
Тези числа ще варират при крайните системи, но показват, че AMD цели същото ниво на “AI фабрика”, както и шкафовите системи на NVIDIA.
Стратегията с партньори: Индия, системни вендори и екосистемен ход
AMD прокарва Helios чрез партньорства. През февруари 2026 г. AMD обяви работа с Tata Consultancy Services (TCS) около дизайн на шкафова AI инфраструктура, базирана на Helios, за внедрявания в Индия.
А Helios навлиза и в света на комерсиалните сървъри: Tom’s Hardware съобщи, че HPE планира да направи системи, базирани на Helios, достъпни по целия свят през 2026 г.
Това е класически ход на AMD: печалба чрез партньорства, стандартни дизайни и много пътища към пазара.
Rubin срещу Helios: краткото, полезно сравнение
И двете платформи са изградени за една и съща реалност: AI вече е ограничен от памет, мрежи и общата ефективност на системата. Затова и двете поставят шкафа на първо място.
Интересните разлики са в това как стигате дотам:
- NVIDIA Rubin = крайна интеграция. NVIDIA подчертава съвместното проектиране през шест чипа и тласка NVLink 6 като ключов шкафов фабрик.
- AMD Helios = отворена шкафова архитектура. AMD акцентира върху съгласуване с OCP, референтни дизайни и екосистема, която може да изгражда Helios-подобни шкафове по различни начини.
За много купувачи решаващите моменти ще са по-малко поетични:
- Софтуерно триене: зрелост на CUDA срещу ROCm за вашите конкретни модели и библиотеки.
- Готовност на мрежата: NVLink 6 е утвърденият път на NVIDIA; плановете на AMD за отворени интерконекти са обещаващи, но зависят от темпото на екосистемата.
- Доставка и наличност: ако не можете да получите целия шкаф навреме, най-добрата пътна карта се превръща в много скъп PDF.
Има ли значение, ако не сте хиперскейлър?
Да, дори ако никога няма да притежавате шкаф с 72 GPU (и предпочитате сградата ви да си остане на земята). Rubin и Helios ще оформят облачните услуги, които много екипи ползват всеки ден.
Когато центровете за данни станат по-ефективни, облачният AI може да стане по-евтин или по-способен. Това може да означава по-големи контекстни прозорци, по-бързи отговори или по-специализирани модели в реални продукти. Може също да означава повече конкуренция между облачните доставчици, защото най-после има повече сериозни хардуерни опции в мащаб.
Има и ефект на “просмукване надолу”. Платформите за центрове за данни често влияят на бъдещите корпоративни сървъри, функции за работни станции, а понякога с времето и на потребителски GPU идеи. Не бива да очаквате “геймърска карта Rubin” следващата седмица, но можете да очаквате надпреварата на платформите да тласка напред неща като по-добра памет, по-добро мислене за интерконект и по-зрели AI софтуерни стекове.
Така че, дори Rubin и Helios да живеят в облака, ефектите ще се появят на екрана ви.
Финален извод
Rubin и Helios показват, че GPU се развиват в пълни платформи: изчисление + памет + фабрик + сигурност + софтуер. Състезанието вече не е “чий чип е по-бърз”, а “чий шкаф остава натоварен, остава защитен и остава достъпен”.
NVIDIA Rubin залага на дълбока интеграция, пропускателна способност за scale-up чрез NVLink и стегнат стек от шест чипа. AMD Helios залага на отвореност, OCP дизайни и много големи внедрявания с партньори, измервани в гигавати.
Имената все още звучат като финал на сезон от сай-фай. Тази част може да е маркетинг. Платформената промяна не е.