Problem
現有的運算架構依賴明確的程式碼、外部執行環境或環境動態模型,難以實現運算邏輯、記憶體與輸入輸出的完全深度學習化。當前的 AI 代理人仍受限於外部環境,缺乏一個能將模型本身視為運行電腦的統一機器型態。
Method
研究團隊將神經電腦實作於影片生成模型,利用 CLI 與 GUI 環境中的指令、像素及使用者動作等輸入輸出軌跡(I/O traces)進行訓練。此方法不需接觸程式內部的儀器化狀態,而是讓模型學會直接從像素流中生成並推演螢幕畫面與互動邏輯。
Results
實驗證明,學習型運行環境已能初步掌握基礎介面原語,特別在輸入輸出對齊與短程控制方面展現出優勢。然而,研究也指出目前的模型在常規程式重用、受控更新以及符號處理的穩定性上,仍有進步空間,並為此規劃了發展藍圖。
Significance
這項研究定義了「完全神經電腦」(CNC)的願景,挑戰了傳統馮紐曼架構。若能克服穩定性與重編程挑戰,神經電腦將跳脫現有 AI 代理人與世界模型的框架,建立一套具備持久能力與通用目的之全新運算範式。