GraphRAG (Graf Tabanlı RAG)

GraphRAG, Microsoft Research tarafından 2024'te tanıtılan ve geleneksel Retrieval Augmented Generation (RAG) sistemini bilgi grafı (knowledge graph) ile güçlendiren bir yaklaşımdır.

GraphRAG, Microsoft Research tarafından 2024'te tanıtılan ve geleneksel Retrieval Augmented Generation (RAG) sistemini bilgi grafı (knowledge graph) ile güçlendiren bir yaklaşımdır. Klasik RAG'de belgeler parçalara bölünüp vektör arama ile getirilen chunk'lar doğrudan modele verilir. GraphRAG ise metin içindeki varlıkları (entity) ve aralarındaki ilişkileri bir grafta depolar; sorgular bu grafı gezerek bütünsel bir bağlam oluşturur. Böylece tüm belgeler boyunca tematik sorular yanıtlamada standart RAG'den üstün performans gösterir.

account_tree GraphRAG Nasıl Çalışır?

GraphRAG iki aşamada çalışır. Hazırlık: belgeler LLM ile analiz edilir; varlıklar (kişi, yer, kavram), ilişkiler ve özetler çıkarılarak bir bilgi grafına eklenir. Sorgu: kullanıcı sorusu için grafta topluluk özetleri (community summaries) oluşturulur ve bu özetler global bir yanıt üretmek üzere LLM'e verilir. Microsoft'un orijinal implementasyonu lokal ve global arama modları sunar.

GraphRAG vs. Standart RAG

search Standart RAG

Vektör benzerliğiyle en ilgili chunk'ları getirir. Yerel, spesifik sorularda güçlüdür. Küresel/tematik sorularda yetersiz kalır.

hub GraphRAG

Varlık ilişkilerini ve topluluk özetlerini kullanır. Tematik ve çok-belge soruları yanıtlar; maliyet ve işlem süresi daha yüksektir.

merge Hibrit Yaklaşım

Yerel sorular için vektör RAG, küresel sorular için GraphRAG birlikte kullanılır. LlamaIndex ve LangChain her ikisini destekler.

quiz Sık Sorulan Sorular

  • check_circle GraphRAG ne zaman kullanılmalı?: Büyük döküman korpuslarda tematik analiz, karmaşık ilişki sorguları ve çapraz belge özetleme gerektiren durumlarda etkilidir.
  • check_circle Nasıl başlanır?: Microsoft'un açık kaynak graphrag Python paketi (pip install graphrag) ve Azure AI Studio üzerinden hazır pipeline mevcuttur.
  • check_circle Dezavantajları nelerdir?: Graf indeksleme maliyeti yüksektir; büyük korpuslar için çok sayıda LLM çağrısı gerekir. Gerçek zamanlı güncellemeler için hafıza kullanımı da artar.