Agent Bazaar：建立 AI 代理人市場的經濟對齊機制，防止演算法崩潰與集體詐欺行為

本研究提出 Agent Bazaar 模擬框架，評估 AI 代理人在市場中的經濟對齊能力。透過強化學習訓練與 EAS 評分指標，成功解決了價格劇烈波動與女巫攻擊導致的信任崩潰問題。

Problem

當大語言模型作為自主經濟代理人直接參與市場時，其集體行為可能引發超越個體失敗的系統性風險。主要挑戰包含：在 B2C 環境下廠商因演算法不穩定導致價格劇烈波動（市場崩潰），以及在 C2C 環境下單一欺詐代理人透過多重身份（女巫攻擊）發布大量虛假列表，嚴重侵蝕市場信任並損害消費者福祉。

Method

研究團隊開發了名為「Agent Bazaar」的多代理人模擬框架，專門評估系統的「經濟對齊」能力。除了提出「穩定型廠商」與「懷疑型守護者」等對齊防禦機制，更採用 REINFORCE++ 演算法搭配自適應課程，訓練出一個具備高經濟對齊性的 9B 模型。此外，研究定義了「經濟對齊分數（EAS）」，整合穩定性、誠信、福祉與獲利四大維度作為量化標準。

Results

實驗發現，現有的尖端模型與開源模型普遍無法在複雜市場中進行自我調節，且失敗程度與模型規模無關。相對地，經過特定強化學習訓練的 9B 模型在表現上優於所有受測的旗艦模型。研究證實經濟對齊能力與通用智能（General Capability）並不正相關，而是一種可以透過標靶訓練獲得的獨立特質。

Significance

隨著 AI 代理人步入真實經濟體，確保其行為符合市場穩定與誠信至關重要。這項研究為評估代理人系統的經濟安全性提供了標準化工具與訓練路徑，不僅揭示了自主代理人引發市場崩潰的潛在風險，也為建構更具韌性且符合社會利益的自主經濟生態系奠定了基礎。