Problem

傳統基於顯式標記(token)生成的語言模型面臨語言冗餘、離散化瓶頸、序列效率低下及語義損失等結構性限制,導致模型在處理複雜內部運算時,難以透過人類可讀的文字軌跡達到最優效能。

Method

研究透過五個維度(基礎、演進、機制、能力、展望)建構統一的技術藍圖。在機制面上,聚焦於架構、表示、運算與優化四大發展主軸;在能力面上,則系統性地歸納潛在空間如何支援推理、規劃、建模、感知、記憶、協作及具身智能等核心能力。

Results

釐清了潛在空間作為原生運算介質的特性,並將其與顯式空間及視覺模型的潛在空間進行區隔。研究揭示了潛在空間在連續性運算中的優勢,證明許多關鍵的內部處理程序在潛在空間中執行比在顯式文字空間更為自然且高效。

Significance

為學術界提供理解語言模型內部運作的新視角,將潛在空間定義為下一代人工智慧的通用運算與系統範式。這不僅整合了現有的技術成果,更為克服目前AI系統的結構性瓶頸並邁向更高階的智慧發展指引了明確方向。