Problem
傳統數學研究流程高度依賴直覺與繁瑣驗證,現有 AI 工具多偏向單點功能,難以支援數學家在構思、文獻搜索及理論建構等長期且具高度不確定性的探索過程。
Method
開發「AI 數學共同研究員」工作台,採用非同步且具狀態管理的代理型 AI(Agentic AI)。系統能管理不確定性、細化使用者意圖、追蹤失敗假說,並直接輸出符合數學規範的原生研究產出,模擬人類專家的協作流程。
Results
在早期測試中,該系統成功協助研究者解決開放性問題並發現新方向;於 FrontierMath Tier 4 基準測試中獲得 48% 的高分,刷新當前 AI 系統在該硬核解題領域的最佳表現紀錄。
Significance
本研究確立了 AI 輔助數學發現的新型互動範式,證明代理型 AI 能深度參與高階學術研究。這不僅能加速數學真理的發現,也為 AI 在其他複雜科學領域的協作應用提供了具備可擴展性的架構。