2B görüntülerden yapay zeka ve bilgisayar görüşü teknikleriyle üç boyutlu modeller oluşturma sürecidir.

3D yeniden yapılandırma (3D Reconstruction), bir veya birden fazla 2B görüntüden, video akışından ya da derinlik sensörü verisinden üç boyutlu geometrik modeller elde etmeye yarayan bilgisayar görüşü ve yapay zeka alanıdır. Yapısal Hareket (Structure from Motion), Çok-Görüş Stereo ve sinirsel ağ tabanlı derinlik tahmini gibi teknikler kullanarak gerçek dünyadaki nesnelerin ve ortamların dijital 3B kopyasını üretir.

Temel Teknikler

3B yeniden yapılandırmanın klasik yöntemi olan Yapısal Hareket (SfM), farklı açılardan çekilen görüntülerdeki anahtar noktaları eşleştirerek kamera hareketini ve seyrek nokta bulutunu eş zamanlı olarak hesaplar. COLMAP gibi yazılımlar bu yöntemi uygulayarak fotoğraf koleksiyonlarından otomatik 3B model üretir. Çok-Görüş Stereo (MVS), kalibre edilmiş birden fazla kameradan alınan görüntülerdeki piksel benzerliklerini kullanarak yoğun nokta bulutu ve mesh oluşturur. SfM ile birlikte kullanıldığında fotorealistik 3B modeller elde etmek mümkün hale gelir. Derin öğrenme tabanlı yaklaşımlarda ise CNN ve Transformer mimarileri, tek görüntüden veya stereo görüntü çiftlerinden derinlik haritası tahmin etmek için eğitilir. Bu modeller, öz-denetimli öğrenme sayesinde büyük etiketli veri seti gerektirmeksizin eğitilebilir.

Sinirsel Ağ Tabanlı Yöntemler

Neural Radiance Fields (NeRF), 2020 yılında Mildenhall ve ekibi tarafından tanıtılan ve 3B yeniden yapılandırma alanını dönüştüren bir yöntemdir. NeRF, belirli bir sahneden alınan görüntü setini bir sinirsel ağa besleyerek sahnedeki her noktanın renk ve yoğunluk değerini öğrenir; böylece yeni bakış açılarından fotogerçekçi görüntüler sentezlenebilir. 3D Gaussian Splatting (3DGS), 2023 yılında Kerbl ve ekibince önerilen ve NeRF'in hesaplama yükünü büyük ölçüde azaltan bir tekniktir. 3D uzaydaki Gaussian dağılımlarını kullanarak sahneleri temsil eder ve gerçek zamanlı yüksek kaliteli render mümkün kılar. Bu sayede 3B içerik üretimi mobil cihazlar ve VR başlıkları gibi sınırlı donanımlarda da gerçekleştirilebilir hale gelmiştir.

Uygulama Alanları

Artırılmış ve sanal gerçeklik (AR/VR) sistemleri, gerçek dünya ortamlarını dijital olarak modellemek ve etkileşimli deneyimler oluşturmak için 3B yeniden yapılandırmayı kullanır. Apple Vision Pro ve Meta Quest gibi cihazlar gerçek zamanlı 3B harita oluşturma algoritmalarına dayanır. Otonom araçlar, çevrelerini 3B olarak haritalandırmak ve engelleri tespit etmek için LiDAR ile kamera sensörlerinden gelen verileri SLAM (Eş Zamanlı Konumlandırma ve Haritalama) yöntemiyle birleştirir. Tıbbi görüntülemede BT ve MRI taramalarından organ ve tümör modellemeleri üretilir, cerrahi planlamada kritik rol oynar. Kültür mirasının dijital arşivlenmesinde ise tarihi yapı ve eserlerin hassas 3B kopyaları oluşturularak koruma çalışmalarına katkı sağlanır.

Bilgisayar Görüşü ile İlişkisi

3B yeniden yapılandırma, derinlik tahmini, nesne tespiti, optik akış ve görüntü bölütleme gibi birçok bilgisayar görüşü göreviyle iç içe geçmektedir. Derinlik tahmini modelleri, 2B görüntülerden mesafe bilgisi üreterek 3B model oluşturma sürecinin temel girdisini sağlar. CNN mimarileri, özellik çıkarma ve derinlik tahmini görevlerinde güçlü performansıyla 3B yeniden yapılandırmanın omurgasını oluşturur. Transformer tabanlı modeller ise uzun mesafeli bağımlılıkları yakaladıkları için çoklu görüntü hizalama ve sahne anlama görevlerinde giderek daha fazla kullanılmaktadır. İki alanın birleşimi, otonom sistemlerden dijital ikiz oluşturmaya kadar geniş bir uygulama yelpazesinin önünü açmaktadır.