RAG Nedir? Yapay Zekanın Dışarıdan Bilgi Almasını Sağlayan Teknik

list_altİçindekilerexpand_more

01RAG Nedir? (Tek Cümleyle)
02Günlük Hayattan Benzetme: Sınavda Açık Kitap
03Teknik Tanım: Sözlük Versiyonu
04RAG Olmadan Yapay Zeka Ne Yapar?
05LLM’nin Bilgi Kesme Tarihi Sorunu
06Halüsinasyon Bağlantısı
07RAG Nasıl Çalışır?
08Adım 1, Soru Vektöre Dönüştürülür (Embedding)
09Adım 2, Vektör Veritabanında Arama
10Adım 3, Bağlam + Soru → Modele Gönderilir
11RAG ile Fine-tuning Arasındaki Fark
12Hangisi Ne Zaman Kullanılır?
132026’da RAG Araçları ve Ekosistemi
14Kimler RAG Kullanıyor?
15Sözlükteki İlgili Terimler
16Sonraki adım

Yapay zekaya şirketteki iç belgeler hakkında soru soruyorsun ama model bildiklerini üretiyor, senin dosyalarını değil. Ya da geçen haftaki yasal değişikliği soruyorsun, model iki yıl önceki bilgiyle yanıt veriyor. Ya da daha kötüsü: var olmayan bir kaynaktan alıntı yapıyor.

Bu üç sorunu birden çözen tekniğin adı: RAG.

RAG’ı genelde bir ajanın “bilgi getirme” katmanı olarak konumlandırırız; bütün resmi görmek istersen sıfırdan bir AI ajan nasıl yapılır rehberindeki yol haritası RAG’in MCP ve tool çağrısıyla nasıl iç içe geçtiğini özetliyor.

RAG nasıl çalışır: soru, embedding, vektör veritabanı ve LLM akışı RAG pipeline: Soru → Embedding → Vektör DB → Bağlam → LLM → Güncel ve kaynaklı yanıt.

💡 Pratiğe geçmek için: RAG’ı kendi makinende Ollama + LangChain + Chroma ile uçtan uca kurmak istiyorsan, Yerel RAG Chatbot Kurulum Rehberi’ne bak — bu makaledeki teoriyi 200 satır Python’da çalışan bir sisteme dönüştürüyor.

RAG Nedir? (Tek Cümleyle)

RAG (Retrieval-Augmented Generation), bir LLM’in yanıt üretmeden önce harici bir bilgi tabanından ilgili belgeleri çekip bu belgelere dayanarak yanıt verdiği mimaridir.

Türkçeye çevirirsek: Bilgi Getirme Destekli Üretim.

Yapay zeka sözlüğümüzde RAG şöyle tanımlanır: “Büyük dil modellerini, sorgu anında erişilen harici bilgi kaynaklarıyla güçlendiren ve böylece hem halüsinasyonu azaltan hem de modelin bilgi kesim tarihinin ötesine geçmesini sağlayan mimari.”

Günlük Hayattan Benzetme: Sınavda Açık Kitap

Klasik bir LLM, sınava sadece ezberlediği bilgiyle giren öğrenci gibidir. Ne kadar iyi ezberlemiş olursa olsun, ders kitabından farklı bir soru gelirse ya boş bırakır ya da “en makul” sandığı şeyi uydurur, buna halüsinasyon diyoruz.

RAG mimarisi ise sınavda açık kitapla çalışmak gibidir. Öğrenci soruyu görür, hemen ders kitabında doğru bölümü arar, sonra o bölüme bakarak yanıt yazar. Bilgisi yoksa “sayfa 47’ye bakın” diyebilir, uydurmaz.

Teknik Tanım: Sözlük Versiyonu

RAG bir model mimarisi değil, bir **çalışma zamanı deseni (runtime pattern)**dir. Modeli değiştirmez; modelin nasıl kullanılacağını değiştirir.

Üç bileşenden oluşur:

Retriever (Bulucu): Soruya en alakalı belge parçalarını bulan sistem
Knowledge Base (Bilgi Tabanı): Doğrulanmış, güncel belgelerden oluşan veri deposu
Generator (Üretici): Bulunan belgelere dayanarak yanıt üreten LLM

Bu bileşenler birbirinden bağımsız geliştirilebilir ve değiştirilebilir. Bilgi tabanını güncellemek için modeli yeniden eğitmek gerekmez.

RAG Olmadan Yapay Zeka Ne Yapar?

RAG’ın neden bu kadar önemli olduğunu anlamak için, saf bir LLM’nin sınırlarına bakmak gerekiyor.

LLM’nin Bilgi Kesme Tarihi Sorunu

Tüm büyük dil modelleri belirli bir tarihte eğitimini tamamlar. Bu tarihe knowledge cutoff (bilgi kesim tarihi) denir. Bu tarihten sonra gerçekleşen olayları model bilmiyor: dün çıkan yasal düzenlemeyi, geçen ay açıklanan araştırma bulgusunu, bu sabah değişen döviz kurunu bilmesi mümkün değil.

RAG bu problemi köklü biçimde çözer. Model ne zaman eğitilmiş olursa olsun, gerçek zamanlı veya güncel belgelerden çekilen bilgiyle yanıt verebilir.

Halüsinasyon Bağlantısı

Saf LLM’lerin en büyük sorunlarından biri halüsinasyondur, modelin bilmediği şeyi uydurmasıdır. Özellikle çok spesifik, nadir veya güncel bilgi içeren sorularda bu risk artar.

RAG bu riski iki şekilde azaltır:

Kaynak zorunluluğu: Model yanıtını belirli belgelerden üretir. Belgelerde olmayan bilgiyi “üretmek” yerine “belgelerde bu bilgi bulunamadı” diyebilir.
Kaynak gösterme: Hangi belgeden ne alındığı takip edilebilir. Kullanıcı yanıtı orijinal belgeyle karşılaştırabilir.

Yapay zeka sözlüğünde halüsinasyon ve RAG’ın ilişkisini detaylı inceleyebilirsiniz.

RAG Nasıl Çalışır?

RAG pipeline’ı üç temel adımda gerçekleşir. Her adımı basit bir örnekle açıklayalım.

Örnek senaryo: “2026 Türkiye vergi mevzuatındaki son değişiklikler neler?” sorusu soruyorsun.

Adım 1, Soru Vektöre Dönüştürülür (Embedding)

Soruyu doğrudan aramak yerine, önce bir embedding modeli soruyu sayısal bir vektöre çevirir.

Embedding, metni matematiksel bir koordinat uzayında bir noktaya dönüştürür. Anlamca yakın olan metinler bu uzayda birbirine yakın noktalarda durur. “Vergi kanunu” ve “mali mevzuat” birbirine yakın vektörler üretir; “vergi kanunu” ve “pizza tarifi” çok uzak vektörler üretir.

Bu adım kritik çünkü basit kelime araması anlam yakalayamaz. “Mükellef” kelimesini aramak, “vergi ödeyen” ifadesini içeren belgeleri bulamaz. Embedding tabanlı arama ise anlam yakınlığını yakalar.

Adım 2, Vektör Veritabanında Arama

Oluşturulan soru vektörü, önceden hazırlanmış vektör veritabanına göre aranır.

Vektör veritabanı, tüm belgelerinizin (PDF’ler, web sayfaları, veritabanı kayıtları) önceden vektörlere dönüştürülmüş hallerini saklar. Retriever, sorunun vektörüne en yakın olan belge parçacıklarını (chunk) bulur ve getirir.

2026 itibarıyla öne çıkan vektör veritabanları: Pinecone, Weaviate, Chroma, pgvector (PostgreSQL eklentisi), Milvus.

Adım 3, Bağlam + Soru → Modele Gönderilir

Retriever en alakalı belge parçacıklarını bulduktan sonra bunları orijinal soruyla birlikte modele gönderir.

Model artık şu tür bir prompt alır:

Aşağıdaki belgelere dayanarak soruyu yanıtla:

[Belge 1: Resmi Gazete, 15 Mayıs 2026 — Vergi Değişiklikleri...]
[Belge 2: Maliye Bakanlığı Genelgesi No: 2026/14...]

Soru: 2026 Türkiye vergi mevzuatındaki son değişiklikler neler?

Model bu belgeleri okur ve onlara dayanarak yanıt üretir. Bilgi tabanında olmayan bir şeyi uydurmak yerine “bu konuya dair sağlanan belgelerden bilgi bulunamadı” diyebilir.

RAG ile Fine-tuning Arasındaki Fark

Bu iki kavram sıkça karıştırılır. Her ikisi de LLM’leri belirli bilgiyle güçlendirmek için kullanılır, ama çalışma şekilleri temelden farklıdır.

Hangisi Ne Zaman Kullanılır?

Özellik	RAG	Fine-tuning
Bilgi güncelleme	Anlık (belgeyi değiştir, bitti)	Yeniden eğitim gerekir
Maliyet	Düşük (inference + retrieval)	Yüksek (GPU, veri hazırlama)
Kaynak gösterme	Var (hangi belgeden alındı)	Yok
Uygun kullanım	Güncel, değişken bilgi	Sabit, alan-spesifik davranış
Halüsinasyon riski	Düşük (kaynağa bağlı)	Orta (model parametreye işlendi)

RAG ne zaman tercih edilir:

Şirket iç belgeleri, yasal metinler, ürün katalogları gibi güncel kalması gereken bilgiler
Yanıtın nereden geldiğini göstermek gerektiğinde (audit, uyumluluk, şeffaflık)
Bilgi tabanı büyük ve sık değişiyorsa
Model davranışını değil, bilgiyi genişletmek istiyorsanız

Fine-tuning ne zaman tercih edilir:

Modelin belirli bir dil tonu veya çıktı formatını öğrenmesi gerektiğinde
Çok özel bir alan jargonu (tıp, hukuk, mühendislik) için model davranışını değiştirmek istediğinde
Bilgi sabitse ve nadiren güncelleme gerektiriyorsa

Gerçek hayatta bu iki teknik çoğu zaman birlikte kullanılır: alan diline uyum için fine-tuning, güncel bilgi için RAG.

2026’da RAG Araçları ve Ekosistemi

RAG ekosistemi hızla gelişiyor. 2026 itibarıyla öne çıkan araçlar:

Framework’ler:

LangChain: Python/JavaScript’te RAG pipeline’ları kurmak için en yaygın framework; kapsamlı entegrasyon desteği
LlamaIndex: Veri bağlantısına odaklanmış, RAG için optimize edilmiş; belge yükleme konusunda güçlü
Haystack: Kurumsal arama ve RAG uygulamaları için açık kaynak çerçeve
Semantic Kernel: Microsoft’un C# ve Python için RAG + agent framework’ü

Hazır RAG platformları:

Azure AI Search: Microsoft’un kurumsal RAG çözümü, OpenAI entegrasyonuyla
Amazon Bedrock Knowledge Bases: AWS’nin yönetilen RAG servisi
Vertex AI: Google’ın Gemini modelleriyle entegre RAG altyapısı

Yerel kurulum yapmak istiyorsan Ollama ve LangChain ile yerel RAG chatbot rehberimize bakabilirsin, tek satır veri dışarı çıkmadan kendi bilgisayarında çalışıyor.

Kimler RAG Kullanıyor?

RAG bugün birçok sektörde aktif olarak kullanılmaktadır:

Hukuk firmaları: İç mevzuat veritabanlarına dayalı sözleşme analizi
Bankacılık: Güncel düzenleyici mevzuata göre uyumluluk kontrolleri
Sağlık: Hasta dosyası ve tıp literatürüne dayalı klinik destek
Müşteri hizmetleri: Ürün kataloğu ve SSS belgelerine dayalı chatbotlar
Eğitim: Ders materyallerine dayalı kişiselleştirilmiş öğrenme asistanları

Sözlükteki İlgili Terimler

RAG’ı kavramak için yapay zeka sözlüğümüzdeki şu terimler temeldir:

RAG, tam teknik tanım ve mimari detaylar için sözlük girişi
Embedding, metni vektöre çevirme; RAG’ın retrieval adımının temeli
Vektör Veritabanı, RAG’da bulunan belgelerin depolandığı özel veritabanı
LLM, RAG’ın generator bileşeni; yanıtı üreten büyük dil modeli
Fine-tuning, RAG’ın alternatifi veya tamamlayıcısı; model davranışını değiştirmek için
Halüsinasyon, RAG’ın çözdüğü temel sorun; modelin bilmediğini uydurması

RAG, yapay zekayı gerçek dünya bilgisiyle buluşturan köprüdür. Özellikle kurumsal uygulamalar, hukuki ve tıbbi asistanlar, müşteri hizmetleri botları için bugün bilinen en etkili halüsinasyon azaltma tekniklerinden biridir. Yapay zeka sözlüğümüzü düzenli inceleyerek bu alandaki en güncel terimleri ve gelişmeleri takip edebilirsiniz.

Sonraki adım

RAG’i kavramsal olarak öğrendikten sonra parçaları üretim hattına bağlamak için şu rehberlere bak:

RAG ile Yerel Chatbot — Ollama + LangChain — bu makaledeki teoriyi uçtan uca çalışan bir uygulamaya dönüştüren rehber.
Vektör Veritabanı Karşılaştırması: Pinecone, Chroma, Weaviate — RAG’in retrieval katmanını taşıyacak depoyu seçmek.
Function Calling ile LLM’leri Sistemlere Bağlamak — RAG araması bir tool olarak nasıl çağrılır.
AI Agent Framework Karşılaştırma: LangGraph, CrewAI, AutoGen — RAG’i ajan döngüsüne yerleştirecek orkestrasyon katmanı.