ME News 消息,4 月 9 日(UTC+8),近日有觀點認為 Meta 公司可能透過其模型強勢回歸前沿競賽。該模型在多項基準測試中取得具體成績:artificial analysis 52%,mmmu-pro 80.4%,HLE 42.8%,arc-agi-2 42.5%,swe-bench pro 52.4%,swe-bench verified 77.4%,GPQA diamond 89.5%。原文作者據此評價其為頂級多模態模型。(來源:InFoQ)
ME News 消息,4 月 9 日(UTC+8),近日有觀點認為 Meta 公司可能透過其模型強勢回歸前沿競賽。該模型在多項基準測試中取得具體成績:artificial analysis 52%,mmmu-pro 80.4%,HLE 42.8%,arc-agi-2 42.5%,swe-bench pro 52.4%,swe-bench verified 77.4%,GPQA diamond 89.5%。原文作者據此評價其為頂級多模態模型。(來源:InFoQ)