tag NLP
Bu sayfada NLP etiketi ile işaretlenmiş tüm yapay zeka kavramlarını inceliyorsunuz.
Attention Mechanism (Dikkat Mekanizması)
Dikkat Mekanizması (Attention), yapay sinir ağlarının uzun verileri (metin, görüntü, ses) işlerken, insanların yaptığına benzer şekilde verinin sadece önemli veya ilgili kısımlarına "odaklanmasını" sağlayan matematiksel bir tekniktir. Transformer mimarisinin ve günümüz büyük dil modellerinin (LLM) arkasındaki yegane sırdır.
BERT (Bidirectional Encoder Representations) (BERT Doğal Dil Modeli)
BERT, 2018 yılında Google tarafından açık kaynak olarak duyurulan ve Doğal Dil İşleme (NLP) dünyasında çığır açan Transformer tabanlı bir yapay zeka modelidir. GPT modelleri sadece "gelecekteki" kelimeyi tahmin etmeye odaklanırken, BERT bir cümleyi sağdan ve soldan iki yönlü (Bidirectional) okuyarak kelimenin tam bağlamını anlar.
Cosine Similarity (Kosinüs Benzerliği)
Kosinüs Benzerliği (Cosine Similarity), doğal dil işlemede ve vektör veritabanlarında, iki farklı kelimenin, cümlenin veya belgenin (Embedding) anlam olarak birbirine ne kadar benzediğini hesaplamak için kullanılan trigonometrik ve matematiksel bir formüldür.
Embedding (Gömme / Vektörleştirme)
Embedding (Gömme), kelimelerin, cümlelerin, görsellerin veya herhangi bir veri tipinin, yapay zekanın anlayabileceği sayısal dizilere (vektörlere) dönüştürülmesi işlemidir. Bu dönüşüm rastgele sayılarla değil, verinin anlamsal (semantik) değerini koruyacak şekilde, çok boyutlu matematiksel bir uzayda koordinatlara yerleştirilmesiyle yapılır.
Generative Pre-trained Transformer (Üretken Ön-eğitimli Dönüştürücü)
GPT (Generative Pre-trained Transformer), OpenAI tarafından geliştirilen ve Transformer mimarisinin Decoder (Kod Çözücü) bölümünü kullanan büyük bir dil modeli serisidir. İnternetteki devasa boyuttaki metin verileri üzerinde denetimsiz olarak "ön-eğitim" (pre-training) alır. Ardından RLHF (İnsan Geri Bildirimi ile Pekiştirmeli Öğrenme) tekniğiyle ince ayar yapılarak sohbet, kod yazma, çeviri ve akıl yürütme gibi görevlerde olağanüstü performans sergileyecek hale getirilir. ChatGPT'nin arkasındaki temel teknolojidir.
Information Retrieval (IR) (Bilgi Erişimi)
Büyük veri kümeleri (örneğin metin belgeleri) içinden kullanıcı sorgusuna en uygun ve alakalı bilgiyi bulup getirme işlemidir. Google ve Bing gibi modern arama motorlarının temelini oluşturan bilgisayar bilimleri dalıdır.
Large Language Model (Büyük Dil Modeli)
Büyük Dil Modelleri (LLM), insan dilini anlamak, çevirmek, özetlemek, metin üretmek ve kod yazmak için milyarlarca (hatta trilyonlarca) parametre ve devasa veri setleriyle eğitilmiş gelişmiş yapay zeka sistemleridir. Genellikle Transformer mimarisi üzerine kuruludurlar. ChatGPT, Google Gemini, Anthropic Claude ve Meta LLaMA günümüzün en popüler Büyük Dil Modeli örnekleridir.
LSTM (Long Short-Term Memory) (Uzun Kısa Vadeli Hafıza)
LSTM, standart RNN'lerin (Tekrarlayan Sinir Ağları) uzun metinleri veya uzun zaman serilerini hatırlayamama (unutkanlık) sorununu çözmek için 1997 yılında icat edilmiş, çok daha gelişmiş bir yapay sinir ağı hücresidir. Transformer mimarileri icat edilene kadar Google Translate ve Siri gibi teknolojilerin ana beyni olarak hizmet vermiştir.
Machine Translation (Makine Çevirisi)
Makine Çevirisi (MT), bilgisayar yazılımlarının insan müdahalesi olmadan metni veya konuşmayı bir dilden (kaynak dil) diğerine (hedef dil) çevirme işlemidir. 1950'lerdeki sözlük tabanlı sistemlerden, 2010'lardaki İstatistiksel Modellere ve günümüzdeki nöral (Neural Machine Translation - NMT) ve Transformer tabanlı büyük dil modellerine doğru büyük bir evrim geçirmiştir.
Named Entity Recognition (NER) (Varlık İsmi Tanıma)
Varlık İsmi Tanıma (NER), Doğal Dil İşlemenin (NLP) bilgi çıkarımı alanında çok kritik bir teknolojidir. Yapay zekanın düz bir metni okuyarak, o metin içindeki özel isimleri (Kişiler, Şirketler, Lokasyonlar, Tarihler, Para birimleri) insan gibi anlayıp otomatik olarak etiketlemesi ve kategorize etmesidir.
Natural Language Generation (NLG) (Doğal Dil Üretimi)
Doğal Dil Üretimi (NLG), bilgisayarın elindeki verilerden, sayılardan veya analizlerden yola çıkarak insanlar tarafından anlaşılabilir, anlamlı ve akıcı metinler veya konuşmalar üretme sürecidir. NLU (Anlama) okumak ise, NLG konuşmak veya yazmaktır.
Natural Language Understanding (NLU) (Doğal Dil Anlama)
Doğal Dil Anlama (NLU), NLP'nin (Doğal Dil İşleme) alt dalı olan ve bilgisayarların sadece kelimeleri okumasını değil, o kelimelerin arkasındaki insan niyetini (intent), duyguyu, bağlamı ve belirsizlikleri kavramasını sağlayan yapay zeka alanıdır. Yazı yazmak veya üretmekle değil, tamamen 'okuduğunu anlamakla' ilgilenir.
RNN (Recurrent Neural Network) (Tekrarlayan Sinir Ağı)
RNN (Tekrarlayan Sinir Ağları), verilerin bir sıraya veya zamana bağlı olduğu (zaman serileri, cümleler, ses dalgaları) problemleri çözmek için tasarlanmış derin öğrenme mimarisidir. Standart sinir ağlarından farkı, bir "hafızaya" sahip olmasıdır; bir kelimeyi okurken o kelimeden önce okuduğu kelimeleri de hatırlar.
Semantic Search (Semantik Arama (Anlamsal Arama))
Semantik Arama, kullanıcının yazdığı sorguyu içindeki tam eşleşen kelimelere göre değil; sorgunun arkasındaki "amaca", "bağlama" ve "anlama" göre analiz edip en alakalı sonuçları getiren yapay zeka destekli arama motoru teknolojisidir. Geleneksel SQL (Kelime) aramalarının yerini almaktadır.
Speech-to-Text (ASR) (Sesten Metne (Otomatik Konuşma Tanıma))
Speech-to-Text veya Otomatik Konuşma Tanıma (ASR), mikrofondan veya ses dosyasından gelen konuşulmuş dili dinleyip analiz ederek kelime kelime yazıya döken (deşifre eden) yapay zeka teknolojisidir. Siri, Google Asistan ve otomatik YouTube altyazılarının arkasındaki güçtür.
Tokenization (Tokenizasyon (Parçalara Ayırma))
Tokenizasyon, doğal dil işleme (NLP) ve Büyük Dil Modellerinde (LLM), insan dilindeki metinlerin bilgisayarın işleyebileceği matematiksel birimlere (token) bölünmesi işlemidir. Yapay zeka kelimeleri bizim gibi okumaz; onları hecelere, harflere veya kelime köklerine parçalayarak (token) her birine benzersiz bir kimlik numarası (ID) atar. Bir cümlenin yapay zekaya yedirilmeden önceki ilk çiğneme adımıdır.
Topic Modeling (Konu Modelleme)
Konu Modelleme, binlerce hatta milyonlarca metin belgesinin (haberler, tweetler, kitaplar) ne hakkında olduğunu tespit etmek için, metinleri tek tek okumadan denetimsiz makine öğrenimi (Örn: LDA algoritması) kullanarak belgelerin içindeki ortak temaları (konuları) ve kelime kümelerini otomatik olarak keşfetme işlemidir.
Transformer (Dönüştürücü Mimarisi)
Transformer, 2017 yılında Google araştırmacıları tarafından "Attention Is All You Need" makalesiyle tanıtılan, derin öğrenmede çığır açan bir yapay sinir ağı mimarisidir. Veriyi sıralı (sequential) olarak işleyen eski RNN ve LSTM modellerinin aksine, Transformer modeli "Self-Attention" (Öz-Dikkat) mekanizması sayesinde tüm girdileri eşzamanlı (paralel) olarak işler. Bu mimari, günümüzdeki ChatGPT, BERT ve Gemini gibi devasa Büyük Dil Modellerinin (LLM) temelini oluşturur.
Vector Space (Vektör Uzayı)
Vektör Uzayı (Vector Space), yapay zekanın (özellikle LLM'lerin) kelimeleri, resimleri ve kavramları depoladığı ve birbiriyle ilişkilendirdiği; bizim algılayabildiğimiz 3 boyutlu dünyanın aksine, binlerce hatta on binlerce matematiksel boyuttan oluşan soyut ve çok boyutlu uzaydır.
Zero-Shot Learning (Sıfır-Atımlı Öğrenme)
Zero-Shot Learning (ZSL), bir yapay zeka modelinin eğitim aşamasında daha önce hiç görmediği ve etiketli verisine sahip olmadığı bir nesneyi, kavramı veya görevi başarılı bir şekilde tanıyabilmesi veya yerine getirebilmesi yeteneğidir. Özellikle ChatGPT gibi büyük dil modellerinde yaygın olarak kullanılan bir kavramdır.