发布时间:2026-05-28
浏览量图标 5次浏览

ripgrep搜15秒的大仓库,Cursor给Agent建了本地索引,查询降至毫秒级

摘要

1M AI News 监测,Cursor 发布技术博客,介绍其为 AI Agent 构建的本地正则搜索索引 Instant Grep。Agent 编码时高度依赖 ripgrep 搜索代码,但在大型单体仓库中单次搜索常耗时超过 15 秒,严重拖慢交互节奏。

Instant Grep 采用稀疏 n-gram(Sparse N-grams)索引方案。传统方案提取所有连续 3 字符片段作为索引键,稀疏方案则基于字符对的频率权重,确定性地提取长度不等的 n-gram。权重函数来自对数 TB 开源代码的字符对频率统计,罕见组合获得更高权重,查询时只需查找极少量 n-gram 即可精准定位候选文件,再对候选集做全文匹配。

索引完全在用户本地构建和查询,不经过服务器。索引基于 Git 提交状态生成,用户和 Agent 的实时修改作为增量层叠加其上,确保 Agent 能立即搜到自己刚写的代码。存储分为两个文件:倒排列表文件和排序查找表,后者通过 mmap 映射到编辑器进程内存,查询时做二分搜索后按偏移量直接读磁盘,内存占用极低。

Cursor 展示了在 Chromium 等大型代码库上的对比:开启 Instant Grep 后,Agent 调查 Bug 和重构任务的搜索等待时间几乎归零,整体耗时显著缩短。该功能配合 Cursor 新模型 Composer 2 使用。

🚀 主流数字货币交易所推荐

安全稳定的交易平台 | 新用户注册享专属福利

Binance币安交易所LOGO

Binance 币安

全球最大加密货币交易所

立即注册 下载APP
OKX欧易交易所LOGO

OKX 欧易

老牌知名数字资产平台

立即注册 下载APP
Bybit交易所LOGO

Bybit

专业合约交易平台

立即注册 下载APP

⚠️ 风险提示:数字货币交易存在风险,请理性投资,谨慎决策

声明:文章不代表币圈子观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
回顶部