Problem
現有的 3D 資產生成技術多側重於靜態幾何外觀,忽略了互動式虛擬世界與具身智慧(Embodied AI)運作所需的物理功能。由於缺乏材質屬性、功能邏輯與層級式動力學限制,使得生成的模型僅有外殼,無法在模擬環境中進行真實的物理互動。
Method
本研究開發了 PhysForge 框架,並建構包含 15 萬件資產的 PhysDB 標記資料庫。系統分為兩階段:首先由視覺語言模型(VLM)擔任「物理建築師」,規劃包含材質與運動約束的層級物理藍圖;接著透過物理擴散模型,利用運動體素注入(KVI)機制,精準合成幾何特徵與動力學參數。
Results
實驗結果顯示,PhysForge 能夠產出符合物理邏輯且可直接用於物理模擬的 3D 資產。相較於現有方法,該模型在功能合理性與模擬就緒度(Simulation-ready)上表現優異,成功為複雜的虛擬互動場景提供高品質且具功能性的數位內容。
Significance
這項研究填補了幾何生成與物理模擬之間的技術鴻溝。PhysForge 不僅為 3D 內容創作提供強大的自動化引擎,更為具身智慧的訓練提供了大規模、具物理基礎的模擬資料,對元宇宙開發與機器人學習領域具有深遠影響。