NVLink Nedir ve Neden Gereklidir?
Yapay zeka modellerinin boyutu büyüdükçe tek bir GPU'nun belleğine ve hesaplama kapasitesine sığmaz hale gelmektedir. Bu durum, modelin birden fazla GPU'ya dağıtılmasını zorunlu kılar. Geleneksel çok-GPU kurulumlarında PCIe veri yolu kullanılır; ancak PCIe, GPU'ların CPU üzerinden haberleşmesini gerektirdiği için hem bant genişliği hem de gecikme açısından sınırlıdır. NVLink, bu sorunu GPU'lar arasında doğrudan yüksek hızlı bağlantı kurarak çözer. GPU'lar NVLink sayesinde CPU'yu devre dışı bırakıp birbirinin belleğine doğrudan erişebilir. Bu mimari, özellikle tensor paralelliği ve pipeline paralelliği gibi dağıtık eğitim yöntemlerinin gerektirdiği yoğun GPU-GPU veri alışverişini çok daha verimli kılar. Sonuç olarak eğitim süreleri kısalır ve GPU'ların boşta beklediği süreler azalır.
Nesle Göre Bant Genişliği Evrimi
NVLink 1.0 — Pascal (2016)
P100 GPU ile tanıtıldı. Toplam 160 GB/s bant genişliği sunarak PCIe'nin o dönemki kapasitesini ikiye katladı.
NVLink 2.0 — Volta (2017)
V100 GPU'larla birlikte 300 GB/s'ye yükseltildi. DGX-1 ve HPC sistemlerinde yaygınlaştı.
NVLink 3.0 — Ampere (2020)
A100 GPU ile 600 GB/s bant genişliğine ulaştı; 12 NVLink bağlantısı ve NVSwitch desteğiyle 8 GPU'yu tek sanal birim gibi kullanmaya olanak tanıdı.
NVLink 4.0 — Hopper (2022)
H100 ve H200 GPU'larla gelen nesil, 900 GB/s bant genişliği ve 18 NVLink bağlantısı sunarak LLM eğitimini hızlandırdı.
NVLink 5.0 — Blackwell (2025)
B200 ve GB200 GPU'larla gelen en güncel sürüm, 1,8 TB/s'ye ulaştı; PCIe 5.0'ın yaklaşık 14 katı kapasiteyle yeni bir çıta belirledi.
NVSwitch: Tam Ağ Topolojisi
İki GPU arasındaki doğrudan NVLink bağlantısı güçlü olmakla birlikte, büyük ölçekli sistemlerde sekiz veya daha fazla GPU'nun tamamının birbiriyle konuşması gerekir. Bunun için NVIDIA, NVSwitch adlı özel bir anahtar yonga tasarladı. NVSwitch, her GPU'yu diğer tüm GPU'lara eşit bant genişliğiyle bağlayan all-to-all bir iletişim ağı oluşturur. NVIDIA HGX H100 platformunda dört NVSwitch yongası kullanılarak sekiz H100 GPU'su birbirine bağlanır ve toplam 3,6 TB/s ikili bant genişliği elde edilir. DGX SuperPOD gibi büyük sistemlerde ise birden fazla HGX düğümü InfiniBand ile birleştirilerek binlerce GPU kümesi oluşturulur. Bu hiyerarşi, LLM eğitiminde model ve veri paralelliğinin verimli biçimde uygulanmasına zemin hazırlar.
Yapay Zeka Eğitimindeki Rolü
- check_circle Tensor Paralelliği: Modelin katmanları GPU'lara bölündüğünde, her aktivasyon adımında GPU'lar arası yoğun veri alışverişi gerekir. NVLink, bu trafiği PCIe'ye kıyasla 14 kat daha hızlı iletir.
- check_circle Gradient Senkronizasyonu: Veri paralel eğitimde her GPU aynı modeli farklı veri yığınlarıyla işler; güncellemelerin senkronize edilmesi için All-Reduce işlemi çalıştırılır. NVLink'in yüksek bant genişliği bu adımı darboğaz olmaktan çıkarır.
- check_circle Büyük Model Çıkarımı: GPT-4 veya Llama 70B gibi modeller tek bir GPU'ya sığmaz. NVLink, katmanları birden fazla GPU'ya dağıtarak düşük gecikmeli çıkarım yapılmasını mümkün kılar.
- check_circle DGX ve HGX Sistemleri: NVIDIA'nın entegre AI sunucuları NVLink ve NVSwitch üzerine kurulmuştur; kullanıcı, sekiz GPU'yu tek bir bellek havuzu gibi programlayabilir.
Sıkça Sorulan Sorular
- check_circle NVLink ile PCIe arasındaki temel fark nedir?: PCIe, GPU'ların CPU üzerinden haberleştiği genel amaçlı bir standart; NVLink ise GPU'lar arasında doğrudan, CPU'yu atlayan yüksek hızlı bir NVIDIA özel bağlantısıdır. NVLink 5.0, PCIe 5.0'ın yaklaşık 14 katı bant genişliği sunar.
- check_circle NVLink tüm NVIDIA GPU'larında mevcut mu?: Hayır. NVLink yalnızca veri merkezi ve workstation GPU'larında (P100, V100, A100, H100, B200 gibi) bulunur. GeForce RTX oyun kartlarının büyük çoğunluğu NVLink desteklemez; bu kartlar için PCIe kullanılır.
- check_circle NVSwitch olmadan NVLink çalışır mı?: Evet; iki GPU doğrudan NVLink ile bağlanabilir. Ancak üç veya daha fazla GPU'yu tam ağ topolojisinde birleştirmek için NVSwitch gereklidir; aksi hâlde tüm GPU çiftleri arasında bant genişliği eşit dağıtılamaz.
- check_circle NVLink 5.0 kaç TB/s bant genişliği sunar?: Blackwell mimarisindeki GB200 GPU'larda kullanılan NVLink 5.0, 1,8 TB/s toplam bant genişliği sağlar. Bu değer, 2022'deki NVLink 4.0'ın (900 GB/s) tam iki katıdır.
- check_circle NVLink AMD veya Intel GPU'larıyla kullanılabilir mi?: Hayır. NVLink, NVIDIA'ya özel kapalı kaynak bir standarttır. AMD ve Intel GPU'lar kendi yüksek hızlı ara bağlantılarına sahiptir: AMD Infinity Fabric ve Intel EMIB/Ponte Vecchio bağlantı teknolojileri bunların başında gelir.