compress Nasıl Çalışır?
70 Milyar parametreli bir LLaMA modelini tıp alanında uzmanlaştırmak istediğinizi varsayalım. Geleneksel yöntemde 70 milyar sayının hepsini güncellemeniz gerekir ki bu aylar ve on binlerce dolar sürer. LoRA, devasa modelin orijinal beynini dondurur (kilitler) ve sadece aralara kendi ufak 'not kağıtlarını' (küçük matrisleri) sıkıştırır. Model çalışırken hem eski beynini hem de bu yeni not kağıtlarını okur. Siz sadece bu minik not kağıtlarını eğittiğiniz için parametre sayısı on binde bire düşer.
LoRA'nın Avantajları
attach_money Maliyet Düşüşü
Veri merkezleri kiralamak yerine RTX 3090/4090 gibi ev tipi ekran kartlarında modellerin özelleştirilebilmesi.
extension Tak-Çıkar Modülerlik
LoRA dosyaları çok küçüktür (birkaç Megabayt). Aynı baz modele; gündüzleri Hukuk LoRA'sını, geceleri Kodlama LoRA'sını saniyeler içinde takıp çıkartabilirsiniz.
image Görsel Üretimde LoRA
Midjourney veya Stable Diffusion'a sadece sizin yüzünüzü veya belli bir sanat stilini öğretmek için en yaygın kullanılan yöntemdir.