Biasanya, penjanaan imej AI adalah berdasarkan pengedaran piksel. Walaupun AI tidak dapat melihat anjing, ia mengetahui cara piksel secara amnya diedarkan apabila mencipta imej anjing. Apabila ia datang kepada model 3D, ia lebih kompleks. Puncak dalam ruang 3D secara semula jadi membawa dimensi tambahan daripada piksel. Sekarang gunakan itu pada setiap bahagian model 3D dan anda mendapat peningkatan besar dalam data. Pasukan di NVIDIA Research menyahut cabaran ini dengan cabaran baharu mereka LATTE3D yang boleh menjana model 3D dalam beberapa saat.
Teks-ke-3D
Walaupun alternatif wujud, kuasa LATTE3D adalah dalam kelajuan dan format. Model yang dihasilkan boleh disepadukan dengan mudah ke dalam perisian lain. Ia juga tidak bermakna ini tidak semestinya mengambil kerja orang. Ini membuka kepada penggunaan kes yang mustahil untuk proses pemodelan tradisional. Seperti yang dicadangkan oleh siaran akhbar, model boleh dioptimumkan untuk, sebagai contoh, menghasilkan hiasan dan perabot untuk menguji mereka untuk bilik dalam masa nyata. Ini pada mulanya mustahil dalam masa nyata kerana seseorang itu perlu berhenti dan memodelkan perabot tertentu yang mereka perlukan setiap kali. Atau bagi pereka landskap untuk menambah pokok dan tumbuh-tumbuhan yang diperlukan dengan cepat. Logik yang sama ini boleh digunakan pada berpuluh-puluh sfera lain. Pemodelan 3D boleh memakan masa yang lama, dan ini membantu banyak projek yang berpotensi menyediakan alternatif.
Atau, kita boleh menggunakan LATTE3D untuk memulakan kaedah teks-ke-4D seperti Align Your Gaussians: https://t.co/tFmJYsIJjW (@HuanLing6, @seungkim0123, @karsten_kreis).
Di sini, kami memulakan dengan "foto DSLR Rottweiler" dan menghidupkan dengan "Anjing berlari pantas." pic.twitter.com/2W9XfblWYt
— Jonathan Lorraine (@jonLorraine9) 21 Mac 2024
Ketersediaan
Walaupun belum dikeluarkan secara meluas, model itu sudah berfungsi dan dilatih untuk membuat haiwan dan objek harian. Ia boleh menjana model hampir serta-merta pada seni bina yang diuji (seperti NVIDIA RTX A6000). LATTE3D juga menyokong pengoptimuman masa ujian pilihan yang membolehkan model berkualiti tinggi dijana, walaupun memerlukan lebih banyak masa untuk dibuat. Selain itu, kenyataan akhbar itu juga mencadangkan model itu boleh digunakan dalam kombinasi dengan model lain untuk mendapatkan animasi yang realistik. Secara keseluruhannya, ia bertujuan untuk memenuhi janjinya untuk membawa AI ke dimensi baharu dengan harapan ia boleh membuka pintu kepada gelombang kreativiti baharu. Sama seperti generasi 2D membawa begitu banyak kegunaan alternatif yang lahir daripada kreativiti orang ramai, saya menjangkakan model seperti LATTE3D akhirnya berkembang secara drastik.
YouTube: Model AI Generatif Teks-ke-3D LATTE3D daripada NVIDIA Research
Dengan mengklik main, anda bersetuju menerima YouTube Syarat Perkhidmatan dan Polisi Privasi. Data boleh dikongsi dengan YouTube/Google.
Kredit foto: Imej ciri adalah simbolik dan menunjukkan Ketua Pegawai Eksekutif NVIDIA Jensen Huang melancarkan pemproses Blackwell.
