Rubin + Helios: NVIDIA ve AMD'den Yeni GPU Platformları Rubin + Helios: NVIDIA ve AMD'den Yeni GPU Platformları

Eskiden yeni bir GPU, daha hızlı bir kart ve daha gürültülü fanlar demekti. 2026’da asıl GPU dramı veri merkezlerinde yaşanıyor: raf sıraları, ciddi bir soğutma planı ve bir trafo merkezine ait olacak kadar kalın görünen güç kabloları. NVIDIA’nın Rubin GPU platformu ve AMD’nin Helios raf ölçeğinde AI platformu da tam oraya geliyor — uzay projeleri gibi duyulan iki isim, ama gerçekte dev ölçekte yapay zekayı kurup çalıştırmaya yönelik sistem tasarımları.

Her iki şirket de aynı fikri zorluyor: artık tek bir çip yetmiyor. Modern bir AI sistemi; bir GPU’ya, bir CPU ortağına, raf içindeki GPU’lar arasında hızlı bağlantılara, raflar arasında hızlı ağ bağlantılarına ve her şeyi aylarca meşgul tutan yazılıma ihtiyaç duyuyor. NVIDIA buna raf düzeyinde aşırı “birlikte tasarım” diyor. AMD ise Helios’u, iş ortaklarıyla inşa edilen, açık ve OCP ile uyumlu bir raf mimarisi olarak çerçeveliyor.

Neden “GPU Platformları” “tek bir GPU”nun Yerini Alıyor

Bugünün en büyük AI modelleri, yalnızca “daha fazla çekirdek”le aşılmayacak sınırlara çarpıyor. Üç kısıt tekrar tekrar karşımıza çıkıyor:

1) Bellek kraldır. Modern modellerin eğitimi ve sunumu devasa bellek kapasitesi ve bant genişliği gerektirir. Bu yüzden HBM (yüksek bant genişlikli bellek) giderek daha önemli hale geliyor.

2) Hızı belirleyen iletişimdir. Güncel iş yüklerinin çoğu, özellikle uzman karışımı (MoE) modeller, GPU’ların birbiriyle hızlı ve öngörülebilir biçimde konuşmasına bağlıdır. MoE modeller “token”ları farklı uzmanlara “yönlendirir”. Bu yönlendirme çok fazla GPU’dan GPU’ya trafik oluşturur. Ara bağlantı zayıfsa pahalı GPU’lar boşta bekler.

3) Token başına maliyet ve güç tüketimi önemlidir. Çıkarım patlama yaşıyor. Artık soru “Bir GPU ne kadar hızlı?” değil; “Watt ve euro başına kaç faydalı token elde ediyorum?” Token başına maliyeti düşüren bir platform; bulut fiyatlandırmasını, model boyutu seçimlerini ve hatta ürün stratejisini değiştirebilir.

Bu nedenle NVIDIA ve AMD, bir rafın tek bir dev bilgisayar gibi davrandığı sistemler satıyor. Artık “platform”, hesaplama çiplerinin yanı sıra bağ omurgasını (rafta ölçeklenme ve raflar arası ölçeklenme) ve makinenin çalışmasını sürdüren güvenlik ile güvenilirlik özelliklerini de kapsıyor.

Rubin ve Helios’un eski lansmanlardan farklı hissettirmesinin nedeni bu. “Yeni GPU kartları”ndan ziyade “yeni veri merkezi yapı taşları” gibiler.

NVIDIA Rubin GPU Platformu 2026: Teknik Özellikler, Çıkış Penceresi ve Öne Çıkanlar

NVIDIA, Rubin’i Blackwell’in halefi olarak konumluyor; Vera Rubin NVL72 gibi raf ölçeğinde sistemler (ve daha küçük HGX sistemleri) etrafında inşa edilmiş. NVIDIA, Rubin’i raf düzeyinde birlikte tasarlanan altı çipli bir platform olarak tanımlıyor: Vera CPU, Rubin GPU, NVLink 6 anahtarı, ConnectX-9 SuperNIC, BlueField-4 DPU ve Spectrum Ethernet anahtarları.

Bu “altı çip” listesi süs değil. NVIDIA şunu söylüyor: Ürün, rafın kendisi. GPU yıldız; ancak onu besleyen, sonuçları taşıyan ve sistemi güvende tutan yardımcı kadro asıl zor işi yapıyor.

Rubin’in Büyük Vaadi: Özellikle MoE ve “Akıl Yürütme Yapay Zekası” için Daha Düşük Token Başına Maliyet

NVIDIA, Rubin’in ajanik yapay zekayı, ileri düzey akıl yürütmeyi ve büyük ölçekli MoE çıkarımını hedeflediğini söylüyor. Lansman mesajlarında NVIDIA, Rubin’in Blackwell’e göre çıkarımda token başına maliyeti 10 kata kadar düşürebildiğini ve bazı MoE modellerini önceki platforma kıyasla 4 kat daha az GPU ile eğitebildiğini iddia ediyor.

Bunlar iddialı söylemler ve gerçek sonuçlar modele ve yazılıma bağlı olacak. Yine de yön net: Rubin, tek bir kıyaslamayı kazanmaktan çok tüm rafı daha verimli kılmak için tasarlandı.

Transformer Engine ve NVFP4: Doğruluktan Ödün Vermeden Verimlilik Peşinde

NVIDIA, Rubin platform sayfasında, NVFP4 performansını doğruluğu koruyarak artırmak için donanım hızlandırmalı uyarlamalı sıkıştırmaya sahip yeni bir Transformer Engine’i öne çıkarıyor. NVIDIA ayrıca Rubin’in NVFP4 çıkarımında 50 petaFLOPS’a kadar ulaşabildiğini belirtiyor.

Neden FP4 gibi biçimlere odaklanılıyor? Çünkü çıkarım çoğu zaman ekonomiye takılıyor. Token başına hesaplama ve bellek maliyetini azaltabilirseniz, daha fazla kullanıcıya hizmet verebilir, daha büyük bağlam pencereleri çalıştırabilir veya bir raf daha satın almadan gecikmeyi düşük tutabilirsiniz.

Dışa Ölçeklenen Ağ: Tek Raf Yeterli Olmadığında

Tek bir raf güçlü olabilir, ancak büyük AI kümeleri birçok rafı birbirine bağlamalıdır. NVIDIA’nın CES sunumunda Rubin platform yığını, dışa ölçekli ağ için Spectrum-X Ethernet Photonics’in yanı sıra ConnectX-9 ve BlueField-4’ü içeriyor.

Bu, önemli bir trende işaret ediyor: ağ gücü ve gecikmesi artık GPU platformu hikayesinin bir parçası. Raflar arası veri hareketi, zaman ve güç açısından, bizzat hesaplama kadar pahalıya mal olabilir.

Zaman Çizelgesi ve Benimsenme Sinyalleri

CES 2026’da NVIDIA, Rubin’in tam üretimde olduğunu ve ortak ürünlerin 2026’nın ikinci yarısında beklendiğini söyledi.
Reuters ayrıca NVIDIA’nın Meta’ya tedarik edeceği çok yıllı anlaşmanın Blackwell ve gelecekteki Rubin AI çiplerini, ayrıca Grace ve Vera CPU’larını içerdiğini bildirdi.
Hiperskalerler bir platform etrafında plan yapıyorsa bu genelde platformun gerçek olacağı — ve yakında — anlamına gelir.

AMD Helios Raf Ölçeğinde AI Platformu: MI450/MI455X, UALink ve Zaman Çizelgesi

Helios, AMD’nin raf ölçeğinde AI’a yanıtı; ancak AMD bunu farklı bir üslupla sunuyor. AMD, Helios’u Meta tarafından Open Compute Project’e sunulan şartnamelere dayanan, açık ve OCP ile uyumlu bir raf tasarımı olarak çerçeveliyor. AMD, Helios’u OEM/ODM ortaklarına bir referans tasarım olarak yayımladığını ve 2026’da hacimli kurulum beklendiğini söylüyor.

Başka bir deyişle: Helios, sıkı biçimde kontrol edilen tek bir yığın olarak değil; birçok sistem üreticisi tarafından kopyalanıp, uyarlanıp, inşa edilmek üzere tasarlandı.

Gerçek Dünyada Helios: Meta Kurulumu ve Gigawatt Ölçeği

24 Şubat 2026’da AMD ve Meta, birden çok nesil boyunca 6 gigawatta kadar AMD Instinct GPU’yu konuşlandırmak için kesin bir ortaklık açıkladı. AMD, ilk gigawatt kurulum için sevkiyatların 2026’nın ikinci yarısında başlamasının beklendiğini; MI450 mimarisine dayalı özel bir Instinct GPU ve ROCm çalıştıran 6. Nesil EPYC “Venice” CPU’ları tarafından güçlendirilen, Helios üzerinde inşa edilecek bir altyapı kullanılacağını belirtti.

“Gigawatt ölçeğinde GPU konuşlandırma”, bu pazarın hobi aşamasını geride bıraktığını gösterir.

Açıklık ve Ara Bağlantı: UALink ve “İlk Adımlar”

Bir raf ölçeği sistem, ölçeklenme omurgası kadar iyidir. Helios, UALink gibi açık ara bağlantılara bağlı; ancak haberler, ilk Helios sistemlerinin önce Ethernet üzerinden UALink kullanabileceğini, doğal UALink’in daha sonra yaygınlaşacağını öne sürüyor.

Alıcılar için açık bağlantılar tedarikçiye bağımlılığı azaltabilir. AMD içinse bu büyük bir ekosistem görevi: donanımın, anahtarlamanın ve yazılımın aynı anda olgunlaşması gerekiyor.

Raf Yoğunluğu ve Performans Hedefleri Hakkında Bildiklerimiz

Bağımsız haberler, Helios’u çok yoğun bir raf tasarımı olarak tanımlıyor. Tom’s Hardware’e göre Helios rafları, yaklaşık 31 TB HBM4 ile 72 adet Instinct MI455X hızlandırıcıyı sığdırabiliyor; çıkarımda yaklaşık 2,9 FP4 exaFLOPS’u ve eğitimde 1,4 FP8 exaFLOPS’u hedefliyor (erken makinelerde Ethernet üzerinden UALink notuyla).

The Next Platform da Helios raf yapılandırmaları ve büyük ölçekli bant genişliği rakamları bildirdi.

Bu sayılar nihai sevkiyat sistemlerine göre değişecek, ancak AMD’nin NVIDIA’nın raf sistemleriyle aynı “yapay zeka fabrikası” seviyesini hedeflediğini gösteriyor.

Ortaklık Stratejisi: Hindistan, Sistem Satıcıları ve Bir Ekosistem Hamlesi

AMD, Helios’u ortaklıklarla ilerletiyor. Şubat 2026’da AMD, Hindistan’daki kurulumlar için Helios tabanlı raf ölçeğinde AI altyapı tasarımı konusunda Tata Consultancy Services (TCS) ile çalıştığını duyurdu.

Ve Helios ticari sunucu dünyasına giriyor: Tom’s Hardware, HPE’nin 2026’da dünya çapında Helios tabanlı sistemleri kullanıma sunmayı planladığını bildirdi.

Bu klasik bir AMD hamlesi: ortaklıklarla, standart tasarımlarla ve çok sayıda pazara giriş yoluyla kazanmak.

Rubin ve Helios: Kısa, Faydalı Karşılaştırma

Her iki platform da aynı gerçeklik için inşa edildi: AI artık bellek, ağ ve toplam sistem verimliliği tarafından sınırlanıyor. Bu yüzden ikisi de rafı önce koyuyor.

İlginç farklar, oraya nasıl ulaştığınızla ilgili:

  • NVIDIA Rubin = aşırı entegrasyon. NVIDIA, altı çip arasında birlikte tasarımı vurguluyor ve NVLink 6’yı temel bir raf kumaşı olarak öne çıkarıyor.
  • AMD Helios = açık raf mimarisi. AMD, OCP uyumunu, referans tasarımları ve farklı şekillerde Helios benzeri raflar inşa edebilecek bir ekosistemi vurguluyor.

Birçok alıcı için nihai belirleyiciler daha az şiirseldir:

  • Yazılım sürtünmesi: Belirli modelleriniz ve kütüphaneleriniz için CUDA ile ROCm olgunluğu.
  • Ağ hazırlığı: NVLink 6, NVIDIA’nın oturmuş yolu; AMD’nin açık ara bağlantı planları umut verici ama ekosistemin zamanlamasına bağlı.
  • Teslimat ve tedarik: Tüm rafı zamanında alamıyorsanız, en iyi yol haritası çok pahalı bir PDF’ye dönüşür.

Hiperskaler Değilseniz Bunun Bir Önemi Var mı?

Evet, 72 GPU’lu bir rafa asla sahip olmasanız bile (ve binanızın yerde kalmasını tercih etseniz de). Rubin ve Helios, pek çok ekibin her gün kullandığı bulut hizmetlerini şekillendirecek.

Veri merkezleri daha verimli hale geldiğinde, bulut AI daha ucuz veya daha yetenekli olabilir. Bu; gerçek ürünlerde daha büyük bağlam pencereleri, daha hızlı yanıtlar veya daha uzmanlaşmış modeller anlamına gelebilir. Ayrıca, nihayetinde ölçekli ciddi donanım seçenekleri arttığı için bulut sağlayıcıları arasında daha fazla rekabet de demek olabilir.

Bir de “damlama etkisi” var. Veri merkezi platformları; kurumsal sunucuları, iş istasyonu özelliklerini ve zamanla bazen tüketici GPU fikirlerini etkiler. Önümüzdeki hafta bir “Rubin oyun kartı” beklememelisiniz; ancak platform yarışı daha iyi bellek teknolojilerini, daha iyi ara bağlantı yaklaşımını ve daha olgun AI yazılım yığınlarını itecektir.

Yani Rubin ve Helios bulutta yaşasa da etkileri ekranınıza yansıyacak.

Son Mesaj

Rubin ve Helios, GPU’ların tam platformlara evrildiğini gösteriyor: hesaplama + bellek + ağ kumaşı + güvenlik + yazılım. Artık rekabet “kimin çipi daha hızlı” değil, “kimin rafı meşgul kalıyor, güvenli kalıyor ve uygun maliyetli kalıyor” sorusu etrafında dönüyor.

NVIDIA Rubin, derin entegrasyona, NVLink ile ölçeklenme bant genişliğine ve sıkı tasarlanmış altı çipli bir yığına bahis oynuyor. AMD Helios, açıklığa, OCP tasarımlarına ve gigawattlarla ölçülen çok büyük ortak konuşlandırmalarına bahis oynuyor.

İsimler hâlâ bir bilim kurgu sezon finali gibi geliyor. O kısım pazarlama olabilir. Platform kayması değil.

Yazarın diğer gönderileri

Claude Code vs. Codex: Neden yapay zekâ kodlama ajanları her yerde?
Makale
Claude Code vs. Codex: Neden yapay zekâ kodlama ajanları her yerde?
Claude Code vs. Codex: özellikleri, iş akışlarını, güvenliği ve kullanım durumlarını karşılaştırın ve yapay zekâ kodlama asistanlarının neden aniden her yerde olduğunu görün.
Güvenilir yapay zekâ, ne zaman “Bu mantıklı değil” demesi gerektiğini bilir
Makale
Güvenilir yapay zekâ, ne zaman “Bu mantıklı değil” demesi gerektiğini bilir
BullshitBench, güvenilir yapay zekânın yalnızca akıcı yanıtlar üretmekle kalmayıp, yanlış varsayımları da tespit etmesi gerektiğini gösteriyor. Yapay zekâ güvenilirliği, itiraz ve yanlış varsayımların tespiti üzerine bir bakış.
Tarayıcı bir ajana dönüşüyor: Arama neden harekete geçmeye başlıyor
Makale
Tarayıcı bir ajana dönüşüyor: Arama neden harekete geçmeye başlıyor
Yapay zekâ araması, yalnızca yanıtlamakla kalmayıp tarayıcı içinde eyleme geçmeyi öğreniyor. İşte tarayıcı ajanlarının SEO’yu, trafiği, gizliliği ve açık webin geleceğini nasıl değiştirdiği.
Anthropic, Pentagon’daki yapay zekâ çatışmasının ilk raundunu kazandı
Makale
Anthropic, Pentagon’daki yapay zekâ çatışmasının ilk raundunu kazandı
Anthropic, Pentagon ile AI anlaşmazlığında mahkemede erken bir zafer kazandı ve bu durum askerî yapay zekâya ilişkin güvenlik önlemleri, sözleşmeler ve kontrol hakkında daha büyük sorular doğuruyor.