hallüsinasyon LLM yapay zeka güvenilirliği RAG prompt mühendisliği model hizalama

LLM Hallüsinasyonu Nedir? Yapay Zeka Neden Hata Yapar

Orta
person Yapay Zeka Uzmanı

LLM hallüsinasyonu — yapay zekanın yanlış bilgi üretmesi kavramını gösteren editorial illustration

Yapay zekaya bir soru sordunuz. Yanıt hem güvenilir hem ikna edici geldi: kaynaklar, isimler, tarihler. Birkaç tıklama sonra her şeyin uydurma olduğunu gördünüz.

Bu senaryo milyonlarca kullanıcının tanıdık deneyimi. 2023 yılında bir New York avukatı, ChatGPT’ye hukuki içtihat aramasını sordu. Model altı mahkeme kararı döktü, dava adları, tarihler ve karar metinleriyle birlikte. Avukat bunları mahkemeye sundu. Karşı taraf itiraz etti; söz konusu kararların hiçbiri gerçek değildi.

Bu tür hatanın adı LLM hallüsinasyonu: modelin yüksek güvenle yanlış bilgi üretmesi. Doğru yazmak için değil, tutarlı yazmak için eğitilmiş bir yapı olduğunda bu beklenen bir çıktıdır.

LLM Hallüsinasyonu Nedir?

Hallüsinasyon terimi tıptan gelir: gerçek olmayan şeyleri gerçekmiş gibi algılamak. Yapay zeka bağlamında ise modelin olgusal olarak yanlış ancak biçimsel olarak tutarlı bilgi üretmesidir.

Büyük dil modelleri bir metni tahmin makinesi olarak çalışır. Her yeni tokeni üretirken eldeki metne bakarak “bir sonraki en olası kelime nedir?” sorusunu yanıtlar. Bu mekanizma dil akışkanlığında çok başarılı; ama gerçek dünya bilgisine doğrudan erişimi yoktur. Model, eğitim sırasında gördüğü verideki kalıplara dayanır.

Sonuç: model “doğru” yazmayı değil, “doğruya benzeyeni” yazmayı öğrenir. Bu ikisi çoğu zaman örtüşür; ama az görülen konularda, güncel olaylarda veya eğitim verisindeki çelişkili durumlarda ayrışır. Model yanlış olduğunu bilmez. Güven skoru yüksek, ton kesin, yanıt düzgün yapılandırılmış.

İnsan hatasından temel farkı budur: bir insan yanlış bir şeyi söylerken genellikle belirsizlik duyar ya da “emin değilim” der. Model bu deneyimi yaşamaz; her yanıt aynı kalibre güvenle gelir.

Hallüsinasyon Türleri

Hallüsinasyon tek tip değildir; birkaç farklı biçimde ortaya çıkar.

Gerçekçi yanlış bilgi: En tehlikeli türdür. Model var olmayan akademik makaleler, sahte kişi biyografileri, uydurulmuş hukuki kararlar üretir. Gerçek isimler, mantıklı tarihler ve ikna edici biçimsel yapıyla sunulur; bu yüzden fark etmek zordur.

Güncel olmayan bilgi: LLM’lerin bir bilgi sınırı (knowledge cutoff) vardır. Bu tarihten sonraki olaylar modelin parametrelerinde bulunmaz. Model gerçek zamanlı bilgiye erişmeden yanıt verirken eski veriyi “doğruymuş gibi” kullanabilir.

Bağlamsal çarpıtma: Model gerçek bir kavramı ya da kişiyi yanlış bir bağlama yerleştirebilir. Örneğin, bir araştırmacının gerçek çalışmasını başka bir konu başlığına atfetmek gibi.

Kendi kendine çelişen çıktılar: Aynı oturum içinde aynı soruyu farklı biçimlerde sormak zaman zaman birbirini çürüten yanıtlar verir. Bu, modelin “bilgisini” hatırlamak yerine her seferinde yeniden tahmin etmesinden kaynaklanır.

Aşırı genelleme: Model, genel geçer bir eğilimi bireysel duruma doğrudan uyguladığında yanlış çıkarım yapabilir. Bir grup için doğru olan, bireysel vaka için geçerli olmayabilir.

Neden Olur? Teknik Köken

Next-token prediction şeması: büyük dil modeli içinde olasılık dağılımları ve sinir ağı katmanları gösteren soyut infografik

LLM’lerin temel çalışma prensibi next-token prediction: her adımda bir sonraki token için olasılık dağılımı hesaplanır ve en yüksek olasılıklı token seçilir. Bu süreç olgusal doğrulukla değil, istatistiksel tutarlılıkla ilgilenir.

Birkaç kritik etken hallüsinasyonu artırır:

Eğitim verisi kalitesi ve çelişkiler: İnternet verisinden derlenen büyük korpuslar hatalı bilgiler, çelişkili kaynaklar ve güncel olmayan içerikler barındırır. Model bu gürültüyü de öğrenir.

Seyrek olgular: Eğitim verisinde az geçen konular için model yeterince güçlü ağırlıklar geliştiremez. Boşluğu doldurmak için mevcut örüntülerden “makul görünen” bir yanıt üretir. Az bilinen hukuki kararlar, niş bilim alanları veya az tanınan kişiler söz konusu olduğunda bu risk artar.

Bağlam penceresi sınırları: Model, bağlam penceresinin ötesindeki bilgiye erişemez. Uzun konuşmalarda veya büyük dökümanlarla çalışırken önceki bağlamı kaybedebilir. Long context LLM mimarilerini ayrı bir yazıda ele aldık.

Bilgi sınırı (knowledge cutoff): Model belirli bir tarihten sonraki bilgiye sahip değildir. Bu tarihten sonraki olaylar sorulduğunda model yanıt üretmeye devam eder; ama gerçek veriyle değil, olasılıklı tahminle.

Hizalanmamış hedef: Model öncelikli olarak kullanışlı ve uyumlu yanıtlar vermeye yönelik optimize edilmiştir. “Bilmiyorum” demek yerine bir şey söylemeye doğru eğilim oluşur.

Gerçek Dünya Örnekleri

Hukuk: Mata v. Avianca davası, hallüsinasyonun somut bir hukuki bedele dönüştüğü dönüm noktasıdır. 2023’te ABD’li avukatlar hukuki araştırmada ChatGPT kullandı. Model altı emsal karar sundu: gerçekçi isimler, tarihler ve atıflarla. Avukatlar bu kararları mahkeme dilekçelerine ekledi. Federal yargıç ilgili kararları araştırınca hiçbirinin var olmadığını tespit etti. Avukatlar para cezasıyla karşılaştı; dava küresel çapta hallüsinasyon riskinin fark edilmesine zemin hazırladı.

Tıp: Klinisyenlere yönelik yapılan çalışmalar, modellerin nadir hastalıklarda ya da güncel klinik kılavuz değişikliklerinde yanlış doz bilgisi veya yanıltıcı tanı önerileri ürettiğini gösteriyor. Bu çıktılar doğrudan zarar vermeden önce fark edilmeyebilir.

Akademi: GPT modellerini kullanan araştırmacıların literatür taramalarında var olmayan makalelere referans verdiği ve bu hataların zaman zaman yayın öncesi editör süreçlerinden geçtiği raporlandı.

Tespit Yöntemleri

Hallüsinasyonu fark etmek sistematik bir yaklaşım gerektirir:

Tutarlılık testi (Consistency sampling): Aynı soruyu farklı biçimlerde birden fazla kez sorun. Yanıtlar tutarsızsa model büyük olasılıkla tahmin yapıyordur.

Kaynak zorunluluğu: Modelden her iddiasını kaynakla desteklemesini isteyin. “Hangi kaynak bunu söylüyor?” sorusu, modeli ya gerçek kaynağa yönlendirir ya da uydurmakta zorlandığını ortaya koyar.

Grounding tabanlı sistemler: Perplexity gibi web erişimi olan ya da RAG mimarisiyle çalışan sistemler, yanıtları belgelenebilir kaynaklara bağlar. Bu tür sistemlerde gerçek dışı üretim belirgin biçimde azalır.

İnsan doğrulaması: Kritik alanlarda çıktıyı bağımsız kaynaklar üzerinden doğrulamak hâlâ en güvenilir yöntemdir.

Azaltma Yöntemleri

Hallüsinasyonu sıfıra indirmek günümüz teknolojisiyle mümkün değil; ama kapsamlı bir risk azaltma stratejisi kurulabilir.

Retrieval-Augmented Generation (RAG): Hallüsinasyonu azaltmada en yaygın pratik yöntem. Model parametrelerine gömülü bilgi yerine, sorgu anında dış bir bilgi tabanından alakalı belgeler çekilerek bağlama eklenir. Model bu belgeler üzerinden yanıt üretir. RAG mimarisini ayrıntılı ele aldık; dinamik versiyonu için Agentic RAG yazısına bakabilirsiniz.

RLHF ve Constitutional AI: İnsan geri bildirimiyle pekiştirmeli öğrenme (RLHF) modeli daha doğru ve tutarlı yanıtlara yönlendirir. Constitutional AI ise ilke tabanlı yaklaşımla modeli kendi çıktılarını değerlendirmeye yönlendirir. Her iki teknik de eğitim aşamasında hallüsinasyon eğilimini azaltır.

Prompt mühendisliği: Doğru yazılmış bir prompt, modeli daha olgusal yanıtlara iter. “Emin değilsen belirt”, “kaynağını yaz”, “adım adım açıkla” gibi talimatlar hallüsinasyon olasılığını düşürür. Prompt mühendisliği konusunu ayrıca ele aldık.

Chain of Thought: Modeli adım adım akıl yürütmeye yönlendirmek hem doğruluğu artırır hem de hataların nerede oluştuğunu görünür kılar. CoT prompting bunu ayrıntılı açıklıyor.

Structured outputs: JSON şeması veya açık bir yapı dayatmak, modeli keyfi içerik üretmekten uzaklaştırır ve doğrulanabilirliği artırır. Structured outputs konusunu ayrı bir yazıda inceledik.

Hallüsinasyon ile Alignment Hatası Arasındaki Fark

İki kavram zaman zaman karıştırılır; ama teknik olarak ayrıdır.

Hallüsinasyon olgusal bir hata: model bir şeyi bilmez ya da yanlış öğrenmiş ve bunu gerçekmiş gibi sunar. Niyet yoktur; salt bir çıktı hatasıdır.

Alignment hatası ise değer ya da talimat sapmasıdır: model ne yapmasını bilir, ama amaca aykırı bir şey yapar. Zararlı içerik üretmek, kullanıcı talimatını görmezden gelmek bu kategoriye girer.

İkisi örtüşebilir. Hallüsinasyon yapan bir model, yanlış bilgiyle zararlı bir tavsiye üretebilir. Ama kök neden farklıdır; dolayısıyla çözüm yolu da ayrışır. Akıl yürüten modellerde bu ayrım özellikle önemli: model daha uzun reasoning zinciri kurduğunda hem daha az hallüsine eder hem de alignment sorunları daha belirgin hale gelir.

Geleceğe Bakış: Sıfır Hallüsinasyon Mümkün mü?

Gerçek zamanlı web erişimi, araç kullanımı (tool use) ve doğrulama katmanları (verification layers) bu riski önemli ölçüde düşürüyor. Modern modeller araç entegrasyonuyla çalışırken kendi parametrelerinden değil, belgelenmiş kaynaklardan yanıt üretir hale geliyor.

Ama sıfır hallüsinasyon henüz ulaşılabilir bir hedef değil. Modeller belirsiz durumlarda “bilmiyorum” demek yerine yanıt üretmeye devam ediyor. Belirsizliği kalibre biçimde ifade edebilen modeller araştırmaların odağında; bu sorun çözüldüğünde güven kalibrasyonu önemli ölçüde iyileşecek.

RAG, tool use ve verification layer’larının birlikte çalıştığı mimarilerde hallüsinasyon oranı ölçülebilir biçimde düşüyor. Tek bir yöntem yeterli değil; katmanlı bir yaklaşım gerekiyor.

Ne Zaman Dikkatli Olunmalı?

Şu durumlarda hallüsinasyon riski özellikle yüksek:

  • Az bilinen kişiler, kurumlar veya niş konular
  • Belirli tarihler, sayılar veya atıflar gerektiren sorgular
  • Modelin bilgi sınırı tarihinden sonraki olaylar
  • Nadir hukuki kararlar, tıbbi kılavuzlar veya teknik standartlar

Bu durumlarda çıktıyı “başlangıç noktası” olarak kullanın, nihai kaynak olarak değil.

Sonuç

LLM hallüsinasyonu, yapay zekanın eğitim mekanizmasından doğan yapısal bir kısıt. Bunu bilerek kullanmak, modelden daha güvenilir sonuçlar almayı kolaylaştırır.

Olgusal doğruluğun önemli olduğu alanlarda modelin yanıtını başka kaynaklarla karşılaştırın; kaynakla desteklenmiş yanıt üretmesini açıkça isteyin. RAG tabanlı sistemler ve iyi tasarlanmış prompt stratejileri bu riski yönetilebilir düzeye indirir.

Hallüsinasyon kavramının terim karşılığını merak ediyorsanız sözlük sayfasına bakabilirsiniz. Azaltma yöntemlerini derinlemesine anlamak için RAG mimarisi iyi bir başlangıç noktası.

auto_stories İlgili Makaleler