tag RLHF
Bu sayfada RLHF etiketi ile işaretlenmiş tüm yapay zeka kavramlarını inceliyorsunuz.
AI Alignment (Yapay Zeka Hizalaması)
Yapay Zeka Hizalaması (AI Alignment), yapay zeka sistemlerinin hedeflerinin, davranışlarının ve amaçlarının insanlığın etik değerleri, niyetleri ve faydası ile uyumlu (aynı hizada) olmasını sağlamaya çalışan çok kritik bir güvenlik ve araştırma alanıdır.
Reasoning Model (Akıl Yürüten Model)
Reasoning model, cevap vermeden önce gizli bir düşünce zinciri ("thinking trace") üretip bunu değerlendiren büyük dil modeli ailesidir. Klasik LLM'ler bir sonraki tokeni doğrudan tahmin ederken, reasoning model bu adımları içselleştirerek problem üzerinde iteratif biçimde çalışır. OpenAI o1/o3, DeepSeek-R1 ve Claude Extended Thinking bu ailenin en bilinen örnekleridir.
Reinforcement Learning (Pekiştirmeli Öğrenme)
Pekiştirmeli Öğrenme (Reinforcement Learning - RL), makine öğreniminin temel kollarından biridir. Sistemin (ajan), belirli bir ortam (environment) içinde deneme yanılma yoluyla eylemler gerçekleştirdiği, doğru hamlelerinde ödül (reward), yanlış hamlelerinde ise ceza (penalty) alarak en yüksek toplam ödüle ulaşacak stratejiyi kendi kendine keşfettiği öğrenme türüdür. İnsanların bisiklete binmeyi öğrenme sürecine çok benzer.
RLHF (Reinforcement Learning from Human Feedback) (İnsan Geri Bildirimiyle Pekiştirmeli Öğrenme)
RLHF, büyük dil modellerinin (LLM) insan değerleri, beklentileri ve etik kurallarıyla uyumlu (alignment) hale getirilmesi için kullanılan en kritik eğitim tekniğidir. İnterneti okuyarak her şeyi öğrenen vahşi bir modeli alıp, ona "insanların ne tür cevaplardan hoşlandığını ve hangilerini tehlikeli bulduğunu" öğreterek yardımsever ve güvenli bir asistana (örn: ChatGPT) dönüştüren süreçtir.