D-NeRF kepanjangan dari Neural Radiance Fields for Dynamic Scenes adalah teknik rendering neural yang menggabungkan pembelajaran mesin dengan penalaran geometris.[1] D-NeRF (Dynamic Neural Radiance Fields) adalah sebuah metode neural rendering yang mengembangkan konsep Neural Radiance Fields (NeRF) ke ranah dinamis, memungkinkan rekonstruksi dan rendering gambar baru dari objek yang mengalami gerakan kaku maupun non-kaku hanya dengan menggunakan kamera tunggal yang bergerak mengelilingi scene.[2]

Konsep

sunting

D-NeRF memperhitungkan faktor waktu sebagai tambahan input, menjadikan pemetaan yang dipelajari menjadi fungsi kontinu 6D yang meliputi posisi 3D (x, y, z), arah pandang kamera (θ, φ), dan waktu (t). Berbeda dengan NeRF yang hanya untuk scene statis, D-NeRF memodelkan deformasi dengan membagi pembelajaran menjadi dua tahap utama: Mengkodekan scene ke dalam ruang kanonik (canonical space).Memetakan representasi kanonik tersebut ke bentuk deformasi scene pada waktu tertentu.

Dua modul jaringan fully-connected (MLP) ini belajar secara simultan, sehingga setelah pelatihan, D-NeRF dapat menghasilkan citra baru dengan kendali penuh atas posisi kamera dan waktu, sehingga dapat mensimulasikan pergerakan objek secara realistis.[3]

Arsitektur Model

sunting

Canonical Network (Ψx): Berfungsi mengkodekan densitas volume dan warna dari scene di konfigurasi kanonik. Diberikan titik 3D dan arah pandang kamera, network ini memprediksi warna yang dipancarkan dan densitas volumetrik.[4] Deformation Network (Ψt): Mengestimasi medan deformasi yang menghubungkan keadaan scene pada waktu t dengan konfigurasi kanonik, yakni memetakan tiap titik pada scene pada waktu tertentu ke posisi kanonik.[5]

Rendering dan pelatihan

sunting

Metode rendering volumetrik diadaptasi dari NeRF dengan menyesuaikan integrasi volumetrik untuk deformasi objek sepanjang waktu. Pemodelan ini memungkinkan render yang realistis menggunakan ray-casting dari titik pandang yang berbeda serta waktu berbeda.[6] Pelatihan dilakukan dengan meminimalkan error kuadrat rata-rata antara warna gambar yang dirender dengan warna gambar asli dari set gambar RGB yang diambil oleh kamera tunggal pada waktu berbeda. D-NeRF dilatih menggunakan teknik positional encoding untuk memperbaiki representasi input dan menggunakan optimizer Adam selama sekitar dua hari pada perangkat GPU Nvidia GTX 1080.

Referensi

sunting
  1. ^ Pumarola, Albert; Corona, Enric; Pons-Moll, Gerard; Moreno-Noguer, Francesc (2020-11-27), D-NeRF: Neural Radiance Fields for Dynamic Scenes, doi:10.48550/arXiv.2011.13961, diakses tanggal 2025-11-18
  2. ^ Gumilar, Jajang; Putranto, Wendry Setiyadi; Wulandari, Eka (2019-07-29). "Kualitas gelatin yang diproduksi dari limbah proses shaving kulit domba menggunakan curing HCl dengan konsentrasi dan waktu yang berbeda". Majalah Kulit, Karet, dan Plastik. 35 (1): 1. doi:10.20543/mkkp.v35i1.4502. ISSN 2460-4461.
  3. ^ Gumilar, Jajang; Putranto, Wendry Setiyadi; Wulandari, Eka (2019-07-29). "Kualitas gelatin yang diproduksi dari limbah proses shaving kulit domba menggunakan curing HCl dengan konsentrasi dan waktu yang berbeda". Majalah Kulit, Karet, dan Plastik. 35 (1): 1. doi:10.20543/mkkp.v35i1.4502. ISSN 2460-4461.
  4. ^ "Albert Pumarola - D-NeRF". www.albertpumarola.com. Diakses tanggal 2025-11-18.
  5. ^ "Albert Pumarola - D-NeRF". www.albertpumarola.com. Diakses tanggal 2025-11-18.
  6. ^ Pumarola, Albert; Corona, Enric; Pons-Moll, Gerard; Moreno-Noguer, Francesc (2021-06). "D-NeRF: Neural Radiance Fields for Dynamic Scenes". 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR): 10313–10322. doi:10.1109/CVPR46437.2021.01018.

📚 Artikel Terkait di Wikipedia

Transformator (pembelajaran mendalam)

[UNK]. Algoritma tokenisasi subkata yang umum digunakan adalah byte pair encoding (BPE) dan model bahasa unigram (ULM), yang masing-masing mencakup algoritma

Ingatan

pelabelan Tahapan utama dalam pembentuk dan pengambilan ingatan adalah: Encoding: proses dan penggabungan informasi yang diterima Penyimpanan: penciptaan

Penglihatan skotopik

Foundations of Vision (1995), Brian A. Wandell, Chapter 4 Wavelength Encoding Diarsipkan 2013-12-07 di Wayback Machine. Foundations of Vision (1995)

Komunikasi

dan mengekspresikannya dalam bentuk pesan. Proses ini disebut pengodean (encoding), yang dilakukan melalui suatu kode atau sistem tanda, misalnya melalui

Evolusi

Baldo A, McClure M (1999). "Evolution and horizontal transfer of dUTPase-encoding genes in viruses and their hosts". J. Virol. 73 (9): 7710–21. PMID 10438861

Kay Tye

1038/nature14366. PMC 4418228. PMID 25925480. Tye, Kay. "Dissecting the Neural Circuits Encoding Positive and Negative Valence". Grantome (dalam bahasa Inggris)

Memori asosiatif (psikologi)

Overman. "The Effects of Item Familiarity on the Neural Correlates of Successful Associative Memory Encoding". Cognitive, Affective, & Behavioral Neuroscience

Model difusi laten

Advances in Neural Information Processing Systems. 33. Curran Associates, Inc.: 6840–6851. Kingma, Diederik P.; Welling, M. (2013). "Auto-Encoding Variational