跳到主要内容

正则匹配提取器:提取全部匹配与捕获组

从任意文本里提取每一个正则匹配,可只取某个捕获组、去重、每行一个、一键复制,全程浏览器本地

  • 本地处理
  • 分类 开发运维
  • 适合 格式化、校验、压缩或检查和代码相关的文本。
//g
标志
输出选项
匹配数: 3
结果
alice@example.com
bob@toolora.info
alice@example.com
匹配数 + 2 个分组
#$0$1$2
1alice@example.comaliceexample.com
2bob@toolora.infobobtoolora.info
3alice@example.comaliceexample.com

这个工具能做什么

一个把文本里所有正则匹配都抓出来的提取器,不是只给你第一个。 粘贴一段文本,写好正则,工具会自动用全局模式跑,你不用再去记 g 标志。每个匹配都连同完整匹配文本和它的各个捕获组一起列出来,所以 你能一次性把日志行的第二列、或者上百个邮箱里的域名都拿出来。可以 切换 i、m、s、u 标志,选择只输出某一个捕获组,去掉重复项,让每个 匹配单独占一行,或者用你指定的分隔符把它们连起来。正则写错时会给 一条清楚的错误提示,而不是一片空白,顶部还有实时的匹配数统计。 全部都是浏览器标签页里运行的纯 JavaScript,你粘贴的文本不离开页面。 100% 浏览器本地,不上传,不需要登录。

工具细节

输入
文本 + 数值 + 结构化内容
页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
输出
即时结果 + 复制
结果区优先给出可操作结果,支持项会显示复制、下载或可视化预览。
隐私
浏览器本地处理
主工具逻辑未发现外部 API 调用,输入通常留在当前标签页内处理。
保存 / 分享
可分享链接状态
关键设置会进入 URL,复制链接后别人能复现同一组参数。
性能预算
首屏 JS ≤ 9 KB
没有声明 WASM 依赖,适合快速打开和移动端使用。
适用场景
开发运维 · 程序员
分类和职业标签用于推荐相关工具、组织内链,并帮助用户快速判断是否适合当前任务。

怎么用

  1. 1. 输入

    把内容粘贴或拖入工具面板。

  2. 2. 处理

    点击按钮,在浏览器内本地处理,文件不上传。

  3. 3. 复制 / 下载

    一键复制结果或下载到本地。

正则匹配提取器 适合怎么用

适合穿插在写代码、查问题、做 Review、上线前的小任务里。

适合开发场景

  • 格式化、校验、压缩或检查和代码相关的文本。
  • 把片段整理好再放进文档、工单、提交或交接材料。
  • 不切换工具,快速检查一个小 payload。

开发检查项

  • 压缩、混淆这类不可逆处理,先对副本操作。
  • 除非确认工具本地处理,不要粘贴密钥和敏感片段。
  • 转换后的代码上线前,仍要跑自己的测试或 lint。

下一步可以接着做

这些入口会把当前任务接到更完整的工具链里。

  1. 1 正则测试 实时测 JavaScript 正则(匹配高亮 / 捕获组 / 替换预览 / 标志可调),浏览器本地 打开
  2. 2 批量查找替换 对大段文本批量查找替换(支持正则、$1 捕获组、全词匹配、大小写开关、多条规则链式应用),全程浏览器本地运算 打开
  3. 3 正则速查表 交互式正则速查表,JS / Python / PCRE 各方言一站查询。 打开

真实使用场景

  • 从一大段文本里把所有 URL 或邮箱都收齐

    你手上有一份粘来的聊天记录、一个抓下来的网页,或者一份满是联系 方式的导出文件,而你只想要里面的链接或地址。填一条 URL 或邮箱 正则,提取器会把每个命中一次性列出来。打开去重,被提到十次的 域名只出现一次,再设成每行一个,把干净列表直接复制进表格或群发 工具。不用再一行一行手动滚动和选中。

  • 从结构化日志行里抽出某一个字段

    服务器日志每一行都塞着时间戳、级别、请求 id 和一段消息。写一条 在请求 id 外面加括号分组的正则,把输出切到那个捕获组,你就能从 成千上万行里得到一列纯粹的 id。配合去重可以数出有多少个不同的 请求,或者用逗号连起来塞进 IN 子句,方便快速查库。

  • 从凌乱的笔记里整理出干净的关键词或标签列表

    话题标签、像 JIRA-1234 这样的工单号、产品 SKU 散落在会议记录和 工单里。一条短正则就能把它们全收上来,去重去掉重复,你就得到 一份整齐的列表,粘进追踪工具或表格。实时匹配数会在你定稿前告诉 你一共抓到了多少个。

  • 在写进代码前先验证一条正则

    在脚本或配置里信任一条正则之前,先粘一段真实样本,逐个分组看清 它到底捕获了什么。把完整匹配和每个编号分组并排看,能抓出那个 经典错误:分组刚好偏了一个字符。等提取出来的列表看着对了,再 放心地把同一条正则复制进代码。

常见踩坑

  • 以为只会有第一个匹配。普通正则在第一个命中就停下,这也是工具强制全局模式的原因;如果你把正则复制进自己的代码,记得加上 g 标志,否则第一个之后的匹配会被悄悄漏掉。

  • 把完整匹配和捕获组搞混。整条正则是第 0 组;括号才产生第 1、第 2 组等等。只想要域名或只想要 id,就在那一段外面加括号,并选对组号,而不是去读整段匹配。

  • 让贪婪量词吞掉太多。像 <.+> 这样的正则跑在 HTML 上,会从这一行第一个尖括号一路匹配到最后一个,而不是一个标签一个标签地分。改用懒惰量词 <.+?> 或取反字符类 <[^>]+>,每个匹配才会卡得紧。

隐私说明

你粘贴的文本、写的正则,以及工具找到的每一个匹配,都是浏览器标签页 里的纯 JavaScript 在处理。没有任何东西被上传、记录或发往服务器。 有一点要留意:分享链接会把正则和选项写进查询字符串,所以把分享 链接粘到聊天里,对方服务器的访问日志会留下这些内容。较长的文本 正文不会写进网址,但只要涉及敏感内容,请优先用复制按钮而不是 分享链接。

常见问题

类似工具组合

做你这行的人, 还会一起用这些。

Made by Toolora · 100% client-side · Updated 2026-06-13