tag Multimodal

Bu sayfada Multimodal etiketi ile işaretlenmiş tüm yapay zeka kavramlarını inceliyorsunuz.

diamond

Gemini (Google Gemini Yapay Zeka)

Gemini, Google DeepMind tarafından baştan aşağı "Doğuştan Çok Modlu" (Natively Multimodal) olacak şekilde inşa edilen, metin, kod, resim, ses ve videoyu aynı anda anlayıp işleyebilen, dünyanın en gelişmiş büyük dil modelleri ailesinden biridir. Google'ın yapay zeka asistanı ve GPT-4'ün en büyük rakibidir.

arrow_forward
hub

Multimodal AI (Çok Modlu Yapay Zeka)

Çok Modlu Yapay Zeka (Multimodal AI), yalnızca metin (text) veya yalnızca görsel (image) işleyebilen eski nesil modellerin aksine, aynı anda birden fazla veri türünü (modaliteyi) -metin, ses, görüntü, video- aynı sinir ağı içinde anlayabilen, sentezleyebilen ve üretebilen yeni nesil yapay zeka mimarisidir. GPT-4o ve Google Gemini bu teknolojinin öncüleridir.

arrow_forward