2026-04-07 13:46:10
3

Numerai 发布的 True Contribution 信号评估方法

摘要

作者: Numerai

编译: ChainCatcher

 

Numerai 发布了一种新的信号评估方法,称为 True Contribution。 True Contribution 是通过将 Numerai 视为端到端的人工智能系统来计算的。通过计算优化投资组合回报率相对于使用可微凸优化层在信号上质押的 NMR 的梯度,Numerai 现在可以浮出水面并激励信号,为我们的对冲基金做出最大的情报贡献。 Numerai 的表现已经不错(过去 12 个月我们的夏普比率* 为 2.54),但 True Contribution 有可能使 Numerai 成为第一个\"IV 型\"对冲基金。

苏联天体物理学家尼古拉卡尔达舍夫提出的卡尔达舍夫等级是一种根据文明利用的能量对技术进步文明进行分级的方法。 I 型文明可以利用其星球上的所有能量。 II 型文明可以利用其太阳系中的所有能量,而 III 型文明可以利用其银河系中的所有能量。

卡尔达舍夫量表不包含创造这些文明的实际蓝图,但它确实为考虑不同类型文明所需技术的思想实验提供了肥沃的土壤。例如,为了成为 II 型文明,我们必须发明类似戴森球的东西来捕获来自太阳的所有能量。为了成为 III 型文明,我们需要自我复制机器人技术以跨越银河系。

那么对冲基金有卡尔达舍夫量表吗?对冲基金中不同水平的技术进步有何意义?

我们可以认为每个对冲基金都在交易一些股票市场预测信号,这些信号应该与股票的未来回报相关。如果该信号可预测未来回报,则信号中最适合买入的股票将具有最高信号值,而最适合做空的股票将具有最低信号值。对于量化对冲基金,他们的信号直接来自他们的数学模型。

我想为对冲基金提出以下 Kardashev 量表,它根据信号的质量对对冲基金进行评级:

I 类对冲基金有一个信号,可以预测交易成本之前的后续回报。

II 类对冲基金有一个信号,可以预测交易成本后的后续回报。

III 类对冲基金有一个信号,可以用来对世界上最好的对冲基金进行有利可图的改变信号。

IV 类对冲基金有一个非常好的信号,以至于没有其他信号可以用来对其进行有利可图的改变。

I 类对冲基金具有预测未来价格走势的能力;然而,这些预测无法获利,因为市场影响成本等交易成本会抵消收益。 II 类对冲基金可以在扣除成本后赚钱,因此违反了有效市场假说。

类型 III 是事情变得有趣的地方,所以让我用一个例子来解释类型 III 对冲基金。假设我们可以找出世界上最好的对冲基金,我们就说它是 Renaissance Technologies。假设在某个平行宇宙中,Two Sigma(另一家对冲基金)的首席执行官决定他唯一想做的就是改善 Renaissance 的信号。他决定给 Renaissance Two Sigma 最好的信号——他们最高质量的股票预测。他将 Two Sigmas 最佳信号上传到 Renaissance 现在可以看到和使用的 FTP 服务器。现在,如果 Renaissance 认为他们自己的信号已经非常好,以至于没有办法使用 Two Sigma 的信号来改变他们的交易获利,那么 Two Sigma 就不是 Type III 对冲基金。但是,如果 Renaissance 有办法使用 Two Sigma 的信号对其交易进行有利可图的改变,那么 Two Sigma 就是 Type III 对冲基金。即使 Renaissance 仍然进行 96% 的相同交易,它们通常会在没有 Two Sigma 信号的情况下进行,但 4% 的可改善 Renaissance 信号的有利可图的交易变更足以使 Two Sigma 成为 III 类对冲基金。

成为 III 类对冲基金比成为 II 类对冲基金要困难得多,因为 II 类对冲基金只需在市场上进行有利可图的交易,而 III 类对冲基金必须对已经产生的信号进行有利可图的改变市场上非常有利可图的交易。

IV 类对冲基金有一个信号,没有人可以对其进行有利可图的改变。 IV 类对冲基金不仅是世界上最好的对冲基金,而且是宇宙中任何地方都没有其他已知信号可以与其改进信号相结合的对冲基金。 (在上面的例子中,如果 Two Sigma 是 Renaissance 交易变更下的 III 类对冲基金,那么 Renaissance 就不是 IV 类对冲基金。)IV 类对冲基金不一定交易具有完美股市预测准确性的完美信号,它只是意味着它交易的信号对目前已知的所有信号都是最大的好处。它完美地整合了所有已知信号。

IV 类对冲基金就像是股市的外星超级智能。这有点像 DeepMind 的 AlphaZero 下围棋的最佳版本,人类(或 AlphaZero 或 AlphaGo 的旧版本)对其游戏进行任何更改都无法改进它。

我认为 IV 类对冲基金还不存在。但我是一种名为 Numerai 的新型对冲基金的创始人,过去几年我一直在进行一个思想实验:IV 类对冲基金的必要属性是什么?能否建立它?

显然,IV 类对冲基金需要能够快速自动地接收任何阻止他们成为 IV 类对冲基金的新信号。如果有 Type IV 对冲基金,那将是最好的对冲基金,因此不可能有任何 Type III 对冲基金的信号不被 Type IV 对冲基金吸收。 IV 类对冲基金必须能够即时吸收任何 III 类信号,否则它们就不是 IV 类对冲基金。正因为如此,IV 类对冲基金需要是一个开放系统,任何人都可以上传新信号,对交易进行所有更改,以便他们能够从中获利。

Renaissance、Two Sigma 或任何其他对冲基金都关闭了前互联网、前区块链的组织设计,这些设计无法创建 Type IV 对冲基金,就像花旗银行的组织设计无法创建比特币一样。 IV 类对冲基金确实是一种全新的事物。它可能看起来和感觉起来更像比特币,而不是二西格码。

当然,IV 类对冲基金的一个明显特性是它需要足够富有才能提供足够的资金来购买所有 III 类信号。如果 Two Sigma 可以对候选 Type IV 对冲基金的交易做出有利可图的改变,那么该 Type IV 对冲基金需要有资金来激励 Two Sigma 完全关闭其交易业务,并将其信号出售给 Type IV 对冲基金。让 Two Sigma 改变他们的信号确实非常昂贵。也许即使 Renaissance 真的想成为 IV 类对冲基金,也负担不起成为 IV 类对冲基金的代价。

IV 类对冲基金必须是购买信号的开放市场。 Numerai 已经是这样一个系统。任何人都可以使用我们的免费混淆数据或使用他们自己的数据向 Numerai 信号提交信号。 Numerai 没有那么多钱,但我们有大约 1.5 亿美元的加密货币 NMR,这使得 Numerai 已经成为迄今为止世界上收入最高的数据科学竞赛,也是互联网上股票市场信号的最大买家。

通过一种开放的方式来接收信号和加密货币来激励人们提交新信号,看起来 Numerai 似乎拥有成为 IV 类对冲基金的合适属性。

但在这一论点中有一个挥之不去的、有害的假设,它隐藏在视线之外。这是一种在思想实验中遗漏但在实际现实中出现的假设。就是这样:Numerai 会知道如何评估一些新信号是否会改善我们现有的良好信号。

Numerai 已经将我们的数据科学家提交的数千个信号组合到我们所说的元模型中。因此,给定一个新信号,我们怎么知道我们可以将其包含在这个已经很大的信号集合中,并让该包含对交易策略产生有利可图的改变?如果没有针对此信号评估问题的良好技术解决方案,就不可能知道信号是否属于 III 类,因此不可能达到 IV 类。

在 Numerai 的这些年里,我们不得不学习如何擅长信号评估。自 Numerai 成立以来,我们对信号评估进行了许多改进。例如,我们推出了 MMC 并在 Numerai 数据科学家将 NMR 质押在他们的模型上以证明他们相信他们的模型能够在样本外工作(泛化)。 MMC 和质押都提高了 Numerai 上的信号质量。

但我们从未解决过信号评估问题。我们无法确定在我们的端到端系统中,信号是否是关于我们现有元模型的 III 类信号。但今天我们宣布了一个我们花了数年时间构建的新系统,称为 True Contribution,它解决了信号评估问题。

假设与未来股票回报高度相关的信号可能对 Numerai 的元模型最有帮助,这似乎很自然。正因为如此,Numerai 多年来一直根据数据科学家在生成与 Numerai 目标(类似于剩余回报)密切相关的信号方面的表现向他们支付报酬。但这会激励 I 类信号,而基于信号与目标相关性的奖励信号并不能准确表示该信号对 Numerai 优化后投资组合回报的真正贡献有多大。基于用户与目标的相关性来奖励用户只是忽略了太多非常重要的细节,例如:信号与其他信号的相关性、它与现有元模型的交互效果或 Numerai 用来转变元模型的数百个投资组合优化参数信号进入由数百只股票组成的平衡投资组合。

显然,我们需要一种信号评估方法来考虑系统中的每个细节,以便能够评估信号是否可以对 Numerai 做出有利可图的改变。

为了端到端,我们需要绘制出信号和与该信号相关的 NMR 股份如何影响 Numerai 优化器构建的最终投资组合的各个方面。

正如您在上图中看到的,Numerai 首先结合了数据科学家的机器学习模型生成的信号。我们通过计算每个信号的权益加权平均值来创建权益加权元模型来做到这一点。在模型上投入大量 NMR 的数据科学家将在 Stake-Weighted Meta 模型中拥有更大的权重。

股权加权元模型仍然只是对约 5000 只全球股票的预测信号。它仍然需要转化为具有数百个风险约束(例如市场、国家和部门风险中和)的现实投资组合,而这正是优化步骤所做的。一旦优化器创建了满足所有风险约束的现实假设投资组合,Numerai 就可以观察投资组合的后续回报。

为了正确评估信号,我们必须考虑信号对上述整个系统的影响,从信号到权益加权元模型,再到优化后投资组合的回报。这就是真正的贡献所做的。

简而言之,真实贡献是对以下问题的回答:如果数据科学家在他们的模型上投入更多(从而增加他们在权益加权元模型中的权重),那么优化后的投资组合回报会发生什么变化?

对于量化金融领域的人来说,您可以将真实贡献视为一种复杂的信号归因。

对于机器学习领域的人来说,上面关于 Numerai 工作原理的图表可能让人想起神经网络架构。而且,如果您曾经构建过神经网络,您可能想知道是否有可能采用关于股权的优化投资组合回报的梯度。这正是真正的贡献。

但是如何通过投资组合优化层计算梯度呢?

事实证明,这可以使用斯坦福大学的 Stephen Boyd、Facebook AI 的 Brandon Amos 等人开发的新技术(参见他们的论文:可微分凸优化层)

通过使用 cvxpylayers,我们可以将 cvxpy 定义的凸投资组合优化作为 PyTorch 模型中的一个层。这使我们能够有效地计算优化投资组合回报相对于股权价值的梯度,并确定提交给 Numerai 的每个信号的真实贡献。

在 True Contribution 投资组合构建中,股权规模、模型的独创性和信号强度都按确切比例考虑在内,在这些比例中,它们对于在 Numerai 实际交易的现实投资组合中产生回报非常重要。

原始信号可以帮助 Numerai 进行与我们原本拥有的交易不同的、更有利可图的交易,现在将获得最高的 NMR 奖励,因此在股权加权元模型中往往具有越来越大的权重。这种奖励反馈对 Numerai 上的每一位数据科学家也很重要,因为他们现在可以改进他们的模型以最大化他们的真实贡献。

借助 True Contribution,Numerai 正在创建一个反馈循环,旨在持续激励信号的创建和提交,从而对我们的对冲基金进行有利可图的改变,并抑制所有其他信号。 Numerai 的每一轮都将成为 Numerai 整体控制论系统的另一次反向传播。反馈和纠错通过分布式 AI 模型层、区块链质押层、元模型和凸优化进行传播。换句话说,随着 Numerai 的每一轮,我们都朝着成为 IV 类对冲基金的方向迈进了一步。

对 True Contribution 的质押将于 4 月 9 日开始,但与此同时,我们在过去约 2 年内为 Numerai 上的每个用户回填了 True Contribution。

结果显示,True Contribution 作为 Numerai 上的新信号评估指标具有巨大潜力。

例如,有许多数据科学家(例如 LANCE_A_LOT)具有非常高的真实贡献排名,但在其他指标(例如与目标的相关性)上的排名要低得多。很明显,至少在最近一段时间内,LANCE_A_LOT 有一个对 Numerai 帮助最大的模型,但他们的贡献并没有得到适当的回报。

HB 是 NASA 喷气推进实验室的一名工程师,从事 Europa Clipper 任务,并且是一名长期的 Numerai 数据科学家。 HB 向 Numerai 提交了多个模型,但他投入最多 NMR 的模型(价值 22,000 美元的 765 NMR)的真实贡献比他的其他模型低得多。就真实贡献而言,他的一些最佳模型根本没有任何股份,这意味着这些优秀模型在元模型中的权重为零,并且根本没有得到奖励。

有了开始对真实贡献进行质押的能力,数据科学家将开始将他们的质押转移到具有最高预期真实贡献的模型上。在这个动态系统中,随着像 HB 和 LANCE_A_LOT 这样的数据科学家调整他们的股份以获得更多的真实贡献,没有理由相信 Numerai 的股份加权元模型不会变得更加智能。

当然,我们不知道我们是否会达到类型IV。但是,如果我们走上成为 IV 型的道路,您希望看到什么类型的东西?我认为要寻找的关键是风险调整后的绩效随着时间和资产管理规模的增加而增加。

随着时间的推移,对冲基金往往会变得更糟。多么悲伤。发生这种情况的原因是信号衰减(随着市场效率的提高,对冲基金开始的交易信号会随着时间的推移而变差)和容量限制(在 1000 万美元时运作良好的交易策略在 1 亿美元时根本不起作用)。

但到目前为止,Numerai 并没有随着时间的推移而变得更糟——它正在变得更好,这是一个非常好的迹象。

在图中的这段时间里,Numerai 的对冲基金 AUM 几乎翻了 10 倍,从大约 700 万美元增至 6400 万美元(仍处于早期阶段)。随着时间的推移,我们的信号衰减和资产管理规模的增长应该会随着时间的推移损害业绩,但我们的风险调整回报率(夏普比率)会随着时间的推移继续增加。这是因为在同一时期,Numerai 在元模型中的抵押模型从 300 个增加到 4000 多个。 Numerai 没有信号衰减,我们有持续的信号恢复——元模型每周都会用最新的信号重建。

在没有 Numerai 用户收到关于他们模型的正确反馈的情况下,即没有真正的贡献......

感谢 Midjourney 的天才们为 AI 生成的封面艺术。 (这里的提示是:\"华尔街的紫色控制论戴森球\")

*夏普比率的计算基于扣除费用后的总回报,并假设无风险利率为 0%。

所提供的夏普比率信息是历史信息,不是未来表现的指南。投资者应意识到投资损失是可能的。不代表任何投资者将或可能实现与所示类似的利润或损失。

声明:文章不代表币圈子观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
回顶部