AI Co-Mathematician：打造專為數學家設計的代理型 AI 工作台，加速前沿理論發現

介紹 AI Co-Mathematician 工作台，透過代理型 AI 支援數學研究全生命週期，能有效處理不確定性並追蹤假說，顯著提升數學家的探索效率與解題能力。

Problem

傳統數學研究流程高度依賴直覺與繁瑣驗證，現有 AI 工具多偏向單點功能，難以支援數學家在構思、文獻搜索及理論建構等長期且具高度不確定性的探索過程。

開發「AI 數學共同研究員」工作台，採用非同步且具狀態管理的代理型 AI（Agentic AI）。系統能管理不確定性、細化使用者意圖、追蹤失敗假說，並直接輸出符合數學規範的原生研究產出，模擬人類專家的協作流程。

在早期測試中，該系統成功協助研究者解決開放性問題並發現新方向；於 FrontierMath Tier 4 基準測試中獲得 48% 的高分，刷新當前 AI 系統在該硬核解題領域的最佳表現紀錄。

本研究確立了 AI 輔助數學發現的新型互動範式，證明代理型 AI 能深度參與高階學術研究。這不僅能加速數學真理的發現，也為 AI 在其他複雜科學領域的協作應用提供了具備可擴展性的架構。