High Bandwidth Memory (Yüksek Bant Genişlikli Bellek)

High Bandwidth Memory, 3B yığımlı DRAM çipleri ve TSV teknolojisiyle GPU ve yapay zeka ivedileyicilerine terabayt/s hızında bellek bant genişliği sağlayan mimaridir.

High Bandwidth Memory (HBM), yapay zeka ivedileyicileri, grafik işlemciler (GPU) ve yüksek performanslı hesaplama (HPC) sistemlerinde kullanılan, sıradan DDR veya GDDR belleklerden çok daha geniş bant genişliği sunan 3B yığımlı bellek teknolojisidir. HBM'nin temel yeniliği, birden fazla DRAM çipini Through-Silicon Via (TSV) adı verilen minik dikey iletkenler aracılığıyla üst üste katmanlayarak çok sayıda veri hattını aynı anda açmasıdır. Bu yığınlar, silikon bir interposer üzerine oturarak işlemciye son derece yakın konumlandırılır; bu sayede veri yolu uzunluğu azalır, gecikme düşer ve saniyede birkaç terabayt mertebesinde veri aktarımı mümkün hale gelir. Geleneksel GDDR belleklerde bant genişliği, bellek çiplerinin PCB üzerinde yan yana dizilmesinden kaynaklanan kablo kısıtlamalarıyla sınırlanır; oysa HBM'de 1024–2048 bit genişliğindeki geniş ara yüzü bu sorunu köklü biçimde çözer. HBM teknolojisinin gelişimi 2013 yılında AMD ve SK Hynix tarafından ortaklaşa başlatılmış, JEDEC standartlarıyla şekillenmiştir. İlk nesil HBM (2015) 128 GB/s bant genişliğiyle başlarken, 2025'te tamamlanan HBM4 standardı yığın başına 2 TB/s eşiğini aşmıştır. NVIDIA H100 ve H200 gibi veri merkezi GPU'larında 80–141 GB HBM3/HBM3e, AMD Instinct MI430X'te ise 432 GB HBM4 kullanılmaktadır. Büyük dil modellerini (LLM) verimli şekilde çalıştırabilmek için gereken devasa parametre yükü göz önüne alındığında, HBM birkaç yıl içinde yapay zeka donanımının olmazsa olmaz bileşeni konumuna gelmiştir. 2025 itibarıyla küresel HBM pazarı 38 milyar dolara ulaşmış; SK Hynix yüzde 62 pay ile sektöre liderlik etmekte, onu Micron ve Samsung izlemektedir.

HBM Nedir ve Neden Gereklidir?

Yapay zeka modellerinin parametre sayısı milyarlardan trilyonlara çıktıkça GPU'ların ve ivedileyicilerin ihtiyaç duyduğu bellek bant genişliği de katlanarak artmaktadır. Geleneksel GDDR bellek, PCB üzerindeki fiziksel kablo kısıtlamaları nedeniyle bu talebi karşılayamamaktadır. High Bandwidth Memory (HBM) bu sorunu üç temel yenilikle çözer: birden fazla DRAM katmanını 3B olarak yığmak, katmanları Through-Silicon Via (TSV) ile dikey biçimde birbirine bağlamak ve tüm yığını bir silikon interposer üzerinde işlemciye milimetrik mesafeye getirmek. Bu sayede binlerce sinyal hattı paralel olarak çalışabilir; 1024 ila 2048 bitlik geniş veri yolu, GDDR6'nın 32 bitlik kanallarıyla kıyaslanamayacak kadar geniş bir bant sunar. Sonuç olarak HBM, aynı güç tüketimi altında GDDR'nin 5-20 katı bant genişliği sağlayabilir.

HBM Nesilleri

HBM1 (2015)

İlk nesil; 128 GB/s bant genişliği, 1024-bit arabirim. AMD Fury GPU'larında kullanıldı.

HBM2 / HBM2e (2018-2020)

NVIDIA V100, A100'de tercih edildi; 1-2 TB/s aralığına ulaştı, kapasite 8-16 GB/yığın.

HBM3 / HBM3e (2022-2023)

NVIDIA H100/H200'de kullanılan standart; 1.2-3.6 TB/s, yığın başına 24-64 GB kapasite.

HBM4 (2025-)

2048-bit arabirim, yığın başına 2 TB/s+, AMD MI430X'te 432 GB HBM4; SK Hynix özel versiyonunda 2.8 TB/s.

Uygulama Alanları

  • check_circle Yapay Zeka İvedileyicileri: NVIDIA H100, H200, AMD Instinct MI300X/MI430X gibi veri merkezi GPU'larında temel bellek teknolojisi; LLM eğitimi ve çıkarımı için zorunludur.
  • check_circle Grafik İşlemciler (GPU): Yüksek çözünürlüklü render ve gerçek zamanlı ışın izleme gerektiren profesyonel grafik istasyonlarında bant genişliği darboğazını ortadan kaldırır.
  • check_circle HPC (Yüksek Performanslı Hesaplama): İklim modelleme, ilaç keşfi, kuantum simülasyonu gibi veri yoğun bilimsel hesaplamalarda makine başına terabayt kapasitesi sunar.
  • check_circle Ağ İşleme ve FPGA: Yüksek hızlı veri merkezi switch'leri ve FPGA tabanlı ivedileyicilerde gecikmeyi minimize etmek için HBM entegrasyonu giderek yaygınlaşmaktadır.

Sıkça Sorulan Sorular

  • check_circle HBM ile GDDR arasındaki temel fark nedir?: GDDR, bellek çiplerini PCB üzerinde yatay olarak sıralayarak dar (genellikle 32-bit) kanallar üzerinden veri aktarır. HBM ise çipleri dikey olarak üst üste yığarak 1024-2048 bit genişliğindeki kısa ve geniş bir yol açar. Bu mimari fark HBM'ye çok daha yüksek bant genişliği ve düşük enerji tüketimi sağlar; ancak üretim maliyeti daha yüksektir.
  • check_circle TSV (Through-Silicon Via) nedir?: TSV, silikon çiplerinin içinden geçen dikey iletken kanalcıklardır. DRAM katmanlarını birbirine bağlayarak yığın içinde kısa ve paralel veri yolları oluşturur. Geleneksel yatay bağlantıların aksine TSV, yüzlerce-binlerce hattı aynı anda aktif tutabilir.
  • check_circle HBM neden tüketici pazarına giremiyor?: HBM'nin üretimi son derece karmaşık (3B yığımlama, TSV, interposer) ve pahalıdır. Bir yığının maliyeti GDDR6'nın 5-10 katına çıkabilir. Bu yüzden HBM şimdilik binlerce dolarlık veri merkezi kartlarıyla sınırlıdır; ancak fiyatlar zamanla düşerse tüketici GPU'larına sızması mümkündür.
  • check_circle HBM4'ün NVIDIA ve AMD kartlarındaki önemi nedir?: NVIDIA'nın Rubin ve AMD'nin MI430X gibi yeni nesil ivedileyicileri HBM4 kullanacaktır. HBM4, yığın başına 2 TB/s bandıyla büyük dil modellerinin eğitim ve çıkarım sürecindeki bellek darboğazını önemli ölçüde azaltacak ve daha büyük modellerin tek bir kartın belleğine sığmasını kolaylaştıracaktır.