Geçen ay bir arkadaşın senden Türk hukuku hakkında bilgi istedi, sen de ChatGPT’ye sordun. Model sana tam, güven verici ve akademik dille yazılmış bir yanıt döndürdü, “Yargıtay Kararı 2019/4521’e göre…” diye başladı. Sonra avukata sordunuz. Böyle bir karar hiç yokmuş.
İşte bu, yapay zeka halüsinasyonu. Ve şu an yapay zeka kullanan hemen herkesin karşılaştığı en kritik sorun bu.
Model, emin olmadığı bilgiyi de aynı güvenle sunar, bunu “bilmiyorum” demekten çok daha olası bulur.
Yapay Zeka Halüsinasyonu Nedir?
Yapay zeka halüsinasyonu, bir LLM’nin (Büyük Dil Modeli) var olmayan olayları, sahte kaynakları veya yanlış bilgileri gerçekmiş gibi sunmasıdır. Model bunu bilerek yapmıyor; aldatmak gibi bir amacı yok. Sorun, modelin çalışma biçiminin doğrudan bir sonucudur.
Yapay zeka sözlüğümüzde halüsinasyon şöyle tanımlanır: “Bir yapay zeka modelinin, eğitim verilerinde bulunmayan veya gerçekle çelişen bilgileri özgüvenle üretmesi durumu.”
Gerçek Dünyadan Bir Örnek
Bir üniversite öğrencisi tezinde kullanmak üzere Türkçe akademik kaynak soruyor:
Kullanıcı: 2018’de yapay zeka etiği üzerine yazılmış önemli Türkçe makaleler neler?
Model: “Prof. Dr. Ahmet Yılmaz’ın ‘Yapay Zeka ve İnsan Onuru’ başlıklı makalesi İTÜ Dergisi’nde yayımlandı (2018, Cilt 12, Sayı 3, s. 45–67)…”
Böyle bir makale, böyle bir yazar, böyle bir yayın yok. Model var olmayan bir varlığı tüm detaylarıyla birlikte üretti, ve hiç tereddüt etmedi.
Teknik Tanım: Sözlük Versiyonu
Yapay zeka sözlüğü açısından bakarsak, halüsinasyon iki temel kategoriye girer:
- Gerçeksel halüsinasyon (Factual hallucination): Modelin dünyada var olan bir gerçekle çelişen üretim yapması
- Sadakat halüsinasyonu (Faithfulness hallucination): Verilen girdiden saparak farklı içerik üretme
Önemli not: Bu kavram tıbbi psikolojideki “halüsinasyon” ile aynı adı taşısa da tamamen farklı bir anlama gelir. Yapay zekada halüsinasyon bir “hata modu”dur, hastalık değil.
Neden Halüsinasyon Oluyor?
Bu soruyu anlamak için, bir LLM’nin nasıl çalıştığını temel düzeyde bilmek gerekiyor.
Eğitim Verisi ve Boşluklar
Büyük dil modelleri internet, kitaplar ve akademik makaleler gibi devasa veri kümelerinden öğrenir. Bu veri kümesinde bazı konular yoğun şekilde temsil edilirken bazı konular ya az kapsanmış ya da hiç yer almamıştır.
Model bir konu hakkında yeterince veri görmediyse ne yapar? Boşluğu, en “makul” görünen içerikle doldurur. Bu genellikle gerçeğe yakın olmayan bir şeydir, ama modelin istatistiksel olarak “bu bağlamda bu cümle tutarlı” dediği bir şeydir.
Türkçe içerik özelinde durum daha kritiktir: İngilizce ile kıyaslandığında Türkçe akademik ve hukuki içerik miktarı çok daha azdır. Bu yüzden Türk hukuku, Türkçe akademik yayınlar veya yerel olaylar hakkında sorgularda halüsinasyon riski belirgin biçimde artar.
Token Tahmini Nasıl Çalışır?
LLM’ler metin üretirken aslında tek bir şey yapar: her adımda bir sonraki token’ı tahmin eder. Token, kabaca bir kelime parçasıdır, bazen tek karakter, bazen birkaç hece, bazen tam bir kelime.
Model şöyle düşünmez: “Bu doğru mu? Bunu bildiğimden emin miyim?”
Model şöyle düşünür: “Bu bağlamda bir sonraki token istatistiksel olarak ne olmalı?”
Bu fark kritik. Model “doğruluk” değil, “tutarlılık” optimize eder. Ve bazen istatistiksel olarak tutarlı olan şey gerçekten uzak olabilir. “Yargıtay Kararı…” gibi bir giriş cümlesi gördüğünde model, bu kalıba uyan en “olası” numarayı üretir, o numaranın gerçekten var olup olmadığını kontrol etme mekanizması yoktur.
Fine-tuning Olmadan Modelin Sınırları
Fine-tuning yapılmamış bir temel model, özellikle belirli bir alana özgü sorularda daha fazla halüsinasyon üretir. Örneğin genel amaçlı bir model, Türk vergi hukuku veya nadir bir hastalığın tedavisi gibi konularda eğitim verisinin çok az olduğu alanlarda “boşluğu doldurmak” zorunda kalır.
İnce ayarlı (fine-tuned) modeller bile halüsinasyondan tamamen muaf değildir, ama halüsinasyon oranı belirgin şekilde düşer.
Kaç Türlü Halüsinasyon Var?
Araştırmacılar yapay zeka halüsinasyonlarını birkaç kategoriye ayırır:
Gerçek Çelişkisi (Factual Hallucination)
Model bilinen bir gerçeğe aykırı bir şey söyler. Örnek: “Einstein fizik değil, kimya Nobel Ödülü aldı.” Bu yanlış, Einstein 1921’de Fizik Nobel’ini aldı. Model bunu “bilmesi” gerekirken eğitim verisindeki bir çakışmadan ötürü yanlış bir sonuca ulaşabilir.
Özellikle şu alanlarda yüksek risk taşır: tarihsel olaylar, istatistikler, bilimsel veriler, kişi biyografileri.
Kaynak Uydurma (Citation Fabrication)
Akademik halüsinasyonun en tehlikeli türü. Model gerçekmiş gibi sunulmuş eksiksiz bir kaynak bilgisi üretir: yazar adı, dergi ismi, yayın yılı, cilt ve sayfa numarası dahil. Öğrenciler ve araştırmacılar bu tuzağa en sık düşen gruptur.
2023’te ABD’de bir avukat, ChatGPT’nin ürettiği altı hayali mahkeme kararını gerçek sanarak dilekçeye yazdı. Yargıç fark edip soruşturma başlattı. Bu olay, halüsinasyonun gerçek dünya sonuçları olabileceğini kamuoyuna ilk kez net biçimde gösterdi.
Cümle Çelişkisi (Intrinsic Hallucination)
Model kendi ürettiği metin içinde çelişir. Paragrafın başında söylediği şeyle sonunda söylediği şey birbiriyle uyuşmaz. Uzun ve karmaşık metinlerde, özellikle çok adımlı akıl yürütme gerektiren konularda daha sık görülür.
Halüsinasyonu Nasıl Fark Edersin?
Bazı pratik kurallar:
Pratik Kontrol Listesi
Şüphe uyarıcı işaretler:
- Model çok spesifik kaynak bilgisi veriyorsa (yazar + yıl + sayfa + dergi)
- Cevap konuya çok özel ve az bilinen bir gerçek içeriyorsa
- Model aşırı kendinden emin, tereddütsüz bir dille yanıt veriyorsa
- Tarihsel olayları çok ayrıntılı anlatıyorsa (özel isimler, tarihler, yerler)
- Türkçe kaynak gösteriyorsa (özellikle akademik veya hukuki)
Doğrulama adımları:
- Verilen kaynakları Google Scholar, dergi sitesi veya kütüphane veri tabanında ara
- İddia edilen istatistikleri orijinal kaynağa kadar izle
- Kritik bilgileri birden fazla yapay zekaya sor, cevapları karşılaştır
- Uzman bir insana sor, özellikle tıp, hukuk, finans gibi alanlarda
Güvenli kullanım alanları (düşük risk):
- Metin düzenleme ve yazım hatası düzeltme
- Genel konsept açıklamaları (ancak kritik kararlar için değil)
- Brainstorming ve fikir üretme
- Kod yazma (sonradan test edilecekse)
Halüsinasyonu Azaltmanın Yolları
Kullanıcı tarafından alınabilecek önlemler:
Daha iyi prompt yazımı: “Eğer bilmiyorsan söyle” veya “Kaynak göster ama uydurma” gibi talimatlar bazen işe yarar, ama garanti değil. Modelin önce kaynağı aramasını sağlamak daha güvenilirdir.
RAG mimarisi: Şirket veya kurum düzeyinde en etkili çözüm. Model, yanıt üretmeden önce doğrulanmış bir bilgi tabanından gerçek belgeler çeker. Bu sayede halüsinasyon oranı dramatik biçimde düşer.
Model seçimi: Bazı modeller belirli alanlarda halüsinasyona daha az yatkındır. 2026 itibarıyla Gemini ve Claude gibi modeller özellikle bilgi doğruluğu konusunda kıyaslamalarda öne çıkmaktadır.
Sıcaklık (temperature) ayarı: Düşük temperature değerleri modeli daha “muhafazakâr” kılar; daha az yaratıcı ama daha tutarlı yanıtlar üretir. API erişimi olanlara önerilir.
Yapay Zeka Sözlüğündeki İlgili Terimler
Halüsinasyonu tam anlamıyla kavramak için yapay zeka sözlüğümüzdeki şu terimlere bakmanızı öneririz:
- LLM (Büyük Dil Modeli), halüsinasyonun yaşandığı temel mimari; modelin “düşünme” biçimi
- Token, modelin metin üretirken kullandığı temel birim; token tahmini halüsinasyonun mekanizmasıdır
- Fine-tuning, modeli belirli bir alana uyarlamak; halüsinasyon oranını düşürebilir
- RAG, gerçek belgelerden bilgi çekerek halüsinasyonu minimize eden mimari
- Eğitim Verisi, modelin öğrendiği kaynak; boşluklar ve hatalar halüsinasyona yol açar
Yapay zeka halüsinasyonu, modellerin bilinçli olarak yalan söylemesi değil, istatistiksel tahmin motorlarının kaçınılmaz bir yan etkisidir. Bunu bilen bir kullanıcı, yapay zekayı çok daha verimli ve güvenli kullanır: doğrulama gerektiren konularda farklı kaynaklarla çapraz kontrol yapar, kritik kararları asla yalnızca yapay zekaya bırakmaz. Yapay zeka sözlüğümüzü düzenli ziyaret ederek bu alandaki en güncel terimleri ve gelişmeleri takip edebilirsiniz.
Sonraki adım
Halüsinasyonu pratikte azaltmanın yolu, modele güvenilir bir bilgi kaynağı vermekten geçer. Bu yüzden şu rehberler doğal devam noktasıdır:
- RAG Nedir? Retrieval-Augmented Generation Açıklaması — halüsinasyonu kaynaklı yanıtla değiştiren mimarinin teorisi.
- RAG ile Yerel Chatbot — Ollama + LangChain — aynı yaklaşımın uçtan uca çalışan, kendi verinle uyumlu uygulaması.