Yapay zekaya şirketteki iç belgeler hakkında soru soruyorsun ama model bildiklerini üretiyor, senin dosyalarını değil. Ya da geçen haftaki yasal değişikliği soruyorsun, model iki yıl önceki bilgiyle yanıt veriyor. Ya da daha kötüsü: var olmayan bir kaynaktan alıntı yapıyor.
Bu üç sorunu birden çözen tekniğin adı: RAG.
RAG’ı genelde bir ajanın “bilgi getirme” katmanı olarak konumlandırırız; bütün resmi görmek istersen sıfırdan bir AI ajan nasıl yapılır rehberindeki yol haritası RAG’in MCP ve tool çağrısıyla nasıl iç içe geçtiğini özetliyor.
RAG pipeline: Soru → Embedding → Vektör DB → Bağlam → LLM → Güncel ve kaynaklı yanıt.
💡 Pratiğe geçmek için: RAG’ı kendi makinende Ollama + LangChain + Chroma ile uçtan uca kurmak istiyorsan, Yerel RAG Chatbot Kurulum Rehberi’ne bak — bu makaledeki teoriyi 200 satır Python’da çalışan bir sisteme dönüştürüyor.
RAG Nedir? (Tek Cümleyle)
RAG (Retrieval-Augmented Generation), bir LLM’in yanıt üretmeden önce harici bir bilgi tabanından ilgili belgeleri çekip bu belgelere dayanarak yanıt verdiği mimaridir.
Türkçeye çevirirsek: Bilgi Getirme Destekli Üretim.
Yapay zeka sözlüğümüzde RAG şöyle tanımlanır: “Büyük dil modellerini, sorgu anında erişilen harici bilgi kaynaklarıyla güçlendiren ve böylece hem halüsinasyonu azaltan hem de modelin bilgi kesim tarihinin ötesine geçmesini sağlayan mimari.”
Günlük Hayattan Benzetme: Sınavda Açık Kitap
Klasik bir LLM, sınava sadece ezberlediği bilgiyle giren öğrenci gibidir. Ne kadar iyi ezberlemiş olursa olsun, ders kitabından farklı bir soru gelirse ya boş bırakır ya da “en makul” sandığı şeyi uydurur, buna halüsinasyon diyoruz.
RAG mimarisi ise sınavda açık kitapla çalışmak gibidir. Öğrenci soruyu görür, hemen ders kitabında doğru bölümü arar, sonra o bölüme bakarak yanıt yazar. Bilgisi yoksa “sayfa 47’ye bakın” diyebilir, uydurmaz.
Teknik Tanım: Sözlük Versiyonu
RAG bir model mimarisi değil, bir **çalışma zamanı deseni (runtime pattern)**dir. Modeli değiştirmez; modelin nasıl kullanılacağını değiştirir.
Üç bileşenden oluşur:
- Retriever (Bulucu): Soruya en alakalı belge parçalarını bulan sistem
- Knowledge Base (Bilgi Tabanı): Doğrulanmış, güncel belgelerden oluşan veri deposu
- Generator (Üretici): Bulunan belgelere dayanarak yanıt üreten LLM
Bu bileşenler birbirinden bağımsız geliştirilebilir ve değiştirilebilir. Bilgi tabanını güncellemek için modeli yeniden eğitmek gerekmez.
RAG Olmadan Yapay Zeka Ne Yapar?
RAG’ın neden bu kadar önemli olduğunu anlamak için, saf bir LLM’nin sınırlarına bakmak gerekiyor.
LLM’nin Bilgi Kesme Tarihi Sorunu
Tüm büyük dil modelleri belirli bir tarihte eğitimini tamamlar. Bu tarihe knowledge cutoff (bilgi kesim tarihi) denir. Bu tarihten sonra gerçekleşen olayları model bilmiyor: dün çıkan yasal düzenlemeyi, geçen ay açıklanan araştırma bulgusunu, bu sabah değişen döviz kurunu bilmesi mümkün değil.
RAG bu problemi köklü biçimde çözer. Model ne zaman eğitilmiş olursa olsun, gerçek zamanlı veya güncel belgelerden çekilen bilgiyle yanıt verebilir.
Halüsinasyon Bağlantısı
Saf LLM’lerin en büyük sorunlarından biri halüsinasyondur, modelin bilmediği şeyi uydurmasıdır. Özellikle çok spesifik, nadir veya güncel bilgi içeren sorularda bu risk artar.
RAG bu riski iki şekilde azaltır:
- Kaynak zorunluluğu: Model yanıtını belirli belgelerden üretir. Belgelerde olmayan bilgiyi “üretmek” yerine “belgelerde bu bilgi bulunamadı” diyebilir.
- Kaynak gösterme: Hangi belgeden ne alındığı takip edilebilir. Kullanıcı yanıtı orijinal belgeyle karşılaştırabilir.
Yapay zeka sözlüğünde halüsinasyon ve RAG’ın ilişkisini detaylı inceleyebilirsiniz.
RAG Nasıl Çalışır?
RAG pipeline’ı üç temel adımda gerçekleşir. Her adımı basit bir örnekle açıklayalım.
Örnek senaryo: “2026 Türkiye vergi mevzuatındaki son değişiklikler neler?” sorusu soruyorsun.
Adım 1, Soru Vektöre Dönüştürülür (Embedding)
Soruyu doğrudan aramak yerine, önce bir embedding modeli soruyu sayısal bir vektöre çevirir.
Embedding, metni matematiksel bir koordinat uzayında bir noktaya dönüştürür. Anlamca yakın olan metinler bu uzayda birbirine yakın noktalarda durur. “Vergi kanunu” ve “mali mevzuat” birbirine yakın vektörler üretir; “vergi kanunu” ve “pizza tarifi” çok uzak vektörler üretir.
Bu adım kritik çünkü basit kelime araması anlam yakalayamaz. “Mükellef” kelimesini aramak, “vergi ödeyen” ifadesini içeren belgeleri bulamaz. Embedding tabanlı arama ise anlam yakınlığını yakalar.
Adım 2, Vektör Veritabanında Arama
Oluşturulan soru vektörü, önceden hazırlanmış vektör veritabanına göre aranır.
Vektör veritabanı, tüm belgelerinizin (PDF’ler, web sayfaları, veritabanı kayıtları) önceden vektörlere dönüştürülmüş hallerini saklar. Retriever, sorunun vektörüne en yakın olan belge parçacıklarını (chunk) bulur ve getirir.
2026 itibarıyla öne çıkan vektör veritabanları: Pinecone, Weaviate, Chroma, pgvector (PostgreSQL eklentisi), Milvus.
Adım 3, Bağlam + Soru → Modele Gönderilir
Retriever en alakalı belge parçacıklarını bulduktan sonra bunları orijinal soruyla birlikte modele gönderir.
Model artık şu tür bir prompt alır:
Aşağıdaki belgelere dayanarak soruyu yanıtla:
[Belge 1: Resmi Gazete, 15 Mayıs 2026 — Vergi Değişiklikleri...]
[Belge 2: Maliye Bakanlığı Genelgesi No: 2026/14...]
Soru: 2026 Türkiye vergi mevzuatındaki son değişiklikler neler?
Model bu belgeleri okur ve onlara dayanarak yanıt üretir. Bilgi tabanında olmayan bir şeyi uydurmak yerine “bu konuya dair sağlanan belgelerden bilgi bulunamadı” diyebilir.
RAG ile Fine-tuning Arasındaki Fark
Bu iki kavram sıkça karıştırılır. Her ikisi de LLM’leri belirli bilgiyle güçlendirmek için kullanılır, ama çalışma şekilleri temelden farklıdır.
Hangisi Ne Zaman Kullanılır?
| Özellik | RAG | Fine-tuning |
|---|---|---|
| Bilgi güncelleme | Anlık (belgeyi değiştir, bitti) | Yeniden eğitim gerekir |
| Maliyet | Düşük (inference + retrieval) | Yüksek (GPU, veri hazırlama) |
| Kaynak gösterme | Var (hangi belgeden alındı) | Yok |
| Uygun kullanım | Güncel, değişken bilgi | Sabit, alan-spesifik davranış |
| Halüsinasyon riski | Düşük (kaynağa bağlı) | Orta (model parametreye işlendi) |
RAG ne zaman tercih edilir:
- Şirket iç belgeleri, yasal metinler, ürün katalogları gibi güncel kalması gereken bilgiler
- Yanıtın nereden geldiğini göstermek gerektiğinde (audit, uyumluluk, şeffaflık)
- Bilgi tabanı büyük ve sık değişiyorsa
- Model davranışını değil, bilgiyi genişletmek istiyorsanız
Fine-tuning ne zaman tercih edilir:
- Modelin belirli bir dil tonu veya çıktı formatını öğrenmesi gerektiğinde
- Çok özel bir alan jargonu (tıp, hukuk, mühendislik) için model davranışını değiştirmek istediğinde
- Bilgi sabitse ve nadiren güncelleme gerektiriyorsa
Gerçek hayatta bu iki teknik çoğu zaman birlikte kullanılır: alan diline uyum için fine-tuning, güncel bilgi için RAG.
2026’da RAG Araçları ve Ekosistemi
RAG ekosistemi hızla gelişiyor. 2026 itibarıyla öne çıkan araçlar:
Framework’ler:
- LangChain: Python/JavaScript’te RAG pipeline’ları kurmak için en yaygın framework; kapsamlı entegrasyon desteği
- LlamaIndex: Veri bağlantısına odaklanmış, RAG için optimize edilmiş; belge yükleme konusunda güçlü
- Haystack: Kurumsal arama ve RAG uygulamaları için açık kaynak çerçeve
- Semantic Kernel: Microsoft’un C# ve Python için RAG + agent framework’ü
Hazır RAG platformları:
- Azure AI Search: Microsoft’un kurumsal RAG çözümü, OpenAI entegrasyonuyla
- Amazon Bedrock Knowledge Bases: AWS’nin yönetilen RAG servisi
- Vertex AI: Google’ın Gemini modelleriyle entegre RAG altyapısı
Yerel kurulum yapmak istiyorsan Ollama ve LangChain ile yerel RAG chatbot rehberimize bakabilirsin, tek satır veri dışarı çıkmadan kendi bilgisayarında çalışıyor.
Kimler RAG Kullanıyor?
RAG bugün birçok sektörde aktif olarak kullanılmaktadır:
- Hukuk firmaları: İç mevzuat veritabanlarına dayalı sözleşme analizi
- Bankacılık: Güncel düzenleyici mevzuata göre uyumluluk kontrolleri
- Sağlık: Hasta dosyası ve tıp literatürüne dayalı klinik destek
- Müşteri hizmetleri: Ürün kataloğu ve SSS belgelerine dayalı chatbotlar
- Eğitim: Ders materyallerine dayalı kişiselleştirilmiş öğrenme asistanları
Sözlükteki İlgili Terimler
RAG’ı kavramak için yapay zeka sözlüğümüzdeki şu terimler temeldir:
- RAG, tam teknik tanım ve mimari detaylar için sözlük girişi
- Embedding, metni vektöre çevirme; RAG’ın retrieval adımının temeli
- Vektör Veritabanı, RAG’da bulunan belgelerin depolandığı özel veritabanı
- LLM, RAG’ın generator bileşeni; yanıtı üreten büyük dil modeli
- Fine-tuning, RAG’ın alternatifi veya tamamlayıcısı; model davranışını değiştirmek için
- Halüsinasyon, RAG’ın çözdüğü temel sorun; modelin bilmediğini uydurması
RAG, yapay zekayı gerçek dünya bilgisiyle buluşturan köprüdür. Özellikle kurumsal uygulamalar, hukuki ve tıbbi asistanlar, müşteri hizmetleri botları için bugün bilinen en etkili halüsinasyon azaltma tekniklerinden biridir. Yapay zeka sözlüğümüzü düzenli inceleyerek bu alandaki en güncel terimleri ve gelişmeleri takip edebilirsiniz.
Sonraki adım
RAG’i kavramsal olarak öğrendikten sonra parçaları üretim hattına bağlamak için şu rehberlere bak:
- RAG ile Yerel Chatbot — Ollama + LangChain — bu makaledeki teoriyi uçtan uca çalışan bir uygulamaya dönüştüren rehber.
- Vektör Veritabanı Karşılaştırması: Pinecone, Chroma, Weaviate — RAG’in retrieval katmanını taşıyacak depoyu seçmek.
- Function Calling ile LLM’leri Sistemlere Bağlamak — RAG araması bir tool olarak nasıl çağrılır.
- AI Agent Framework Karşılaştırma: LangGraph, CrewAI, AutoGen — RAG’i ajan döngüsüne yerleştirecek orkestrasyon katmanı.