tag Multimodal
Bu sayfada Multimodal etiketi ile işaretlenmiş tüm yapay zeka kavramlarını inceliyorsunuz.
Gemini (Google Gemini Yapay Zeka)
Gemini, Google DeepMind tarafından baştan aşağı "Doğuştan Çok Modlu" (Natively Multimodal) olacak şekilde inşa edilen, metin, kod, resim, ses ve videoyu aynı anda anlayıp işleyebilen, dünyanın en gelişmiş büyük dil modelleri ailesinden biridir. Google'ın yapay zeka asistanı ve GPT-4'ün en büyük rakibidir.
Multimodal AI (Çok Modlu Yapay Zeka)
Çok Modlu Yapay Zeka (Multimodal AI), yalnızca metin (text) veya yalnızca görsel (image) işleyebilen eski nesil modellerin aksine, aynı anda birden fazla veri türünü (modaliteyi) -metin, ses, görüntü, video- aynı sinir ağı içinde anlayabilen, sentezleyebilen ve üretebilen yeni nesil yapay zeka mimarisidir. GPT-4o ve Google Gemini bu teknolojinin öncüleridir.