Prime Intellect 開源自演化 AI 代理環境，內含 8,000 多個工具

摘要

Prime Intellect 於 5 月 19 日（UTC+8）開源了其自演化 AI 代理環境，包含 4,504 個任務和 8,000 多個工具。該對抗系統使用合成器與求解器，從基本任務出發，透過五個難度等級中的九種策略進行演化。僅保留符合通過率門檻的任務，最困難的任務將作為新的種子。在使用 4,400 條合成軌跡對 30B 參數模型進行微調後，BFCL 基準的表現從 18.9% 提升至 52.3%。此舉可能透過減少對人工標註資料集的依賴，影響流動性與加密貨幣市場，並有助於 CFT 優化。

AIMPACT 消息，5 月 19 日（UTC+8），據動察 Beating 監測，Prime Intellect 宣布開源智能體訓練環境 general-agent，這是一個可自我進化的完全合成環境。此次發布的核心是將任務生成設定為一場雙玩家博弈：由合成器和求解器交替對抗，目前已自動構建出包含 4504 個任務、逾 8000 個獨特工具的大型狀態資料庫。該框架從簡單的種子任務起步，通過條件約束、噪音指令、跨實體耦合等 9 種策略，將任務切分為 t0 到 t4 五個難度階梯。合成器負責設計帶有資料庫、交互工具和驗證函數的任務，求解器則負責嘗試通關。只有通過率落在特定難度區間的任務才會被保留，最難層級會作為下一波進化的種子。官方實測顯示，僅用該環境合成的 4400 餘條軌跡對 30B 參數模型進行微調，就在 BFCL 基準測試中將工具調用準確率從 18.9% 提升至 52.3%。這種機制讓模型脫離了對人工標註靜態資料集的依賴。通過模型間的直接博弈，系統能夠源源不斷地自动生成難度可控、帶有語義驗證的訓練語料。（來源：BlockBeats）