从任意文本里提取每一个正则匹配,可只取某个捕获组、去重、每行一个、一键复制,全程浏览器本地
- 本地处理
- 分类 开发运维
- 适合 格式化、校验、压缩或检查和代码相关的文本。
alice@example.com bob@toolora.info alice@example.com
| # | $0 | $1 | $2 |
|---|---|---|---|
| 1 | alice@example.com | alice | example.com |
| 2 | bob@toolora.info | bob | toolora.info |
| 3 | alice@example.com | alice | example.com |
这个工具能做什么
一个把文本里所有正则匹配都抓出来的提取器,不是只给你第一个。 粘贴一段文本,写好正则,工具会自动用全局模式跑,你不用再去记 g 标志。每个匹配都连同完整匹配文本和它的各个捕获组一起列出来,所以 你能一次性把日志行的第二列、或者上百个邮箱里的域名都拿出来。可以 切换 i、m、s、u 标志,选择只输出某一个捕获组,去掉重复项,让每个 匹配单独占一行,或者用你指定的分隔符把它们连起来。正则写错时会给 一条清楚的错误提示,而不是一片空白,顶部还有实时的匹配数统计。 全部都是浏览器标签页里运行的纯 JavaScript,你粘贴的文本不离开页面。 100% 浏览器本地,不上传,不需要登录。
工具细节
- 输入
- 文本 + 数值 + 结构化内容
- 页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
- 输出
- 即时结果 + 复制
- 结果区优先给出可操作结果,支持项会显示复制、下载或可视化预览。
- 隐私
- 浏览器本地处理
- 主工具逻辑未发现外部 API 调用,输入通常留在当前标签页内处理。
- 保存 / 分享
- 可分享链接状态
- 关键设置会进入 URL,复制链接后别人能复现同一组参数。
- 性能预算
- 首屏 JS ≤ 9 KB
- 没有声明 WASM 依赖,适合快速打开和移动端使用。
- 适用场景
- 开发运维 · 程序员
- 分类和职业标签用于推荐相关工具、组织内链,并帮助用户快速判断是否适合当前任务。
怎么用
-
1. 输入
把内容粘贴或拖入工具面板。
-
2. 处理
点击按钮,在浏览器内本地处理,文件不上传。
-
3. 复制 / 下载
一键复制结果或下载到本地。
正则匹配提取器 适合怎么用
适合穿插在写代码、查问题、做 Review、上线前的小任务里。
适合开发场景
- 格式化、校验、压缩或检查和代码相关的文本。
- 把片段整理好再放进文档、工单、提交或交接材料。
- 不切换工具,快速检查一个小 payload。
开发检查项
- 压缩、混淆这类不可逆处理,先对副本操作。
- 除非确认工具本地处理,不要粘贴密钥和敏感片段。
- 转换后的代码上线前,仍要跑自己的测试或 lint。
下一步可以接着做
这些入口会把当前任务接到更完整的工具链里。
真实使用场景
从一大段文本里把所有 URL 或邮箱都收齐
你手上有一份粘来的聊天记录、一个抓下来的网页,或者一份满是联系 方式的导出文件,而你只想要里面的链接或地址。填一条 URL 或邮箱 正则,提取器会把每个命中一次性列出来。打开去重,被提到十次的 域名只出现一次,再设成每行一个,把干净列表直接复制进表格或群发 工具。不用再一行一行手动滚动和选中。
从结构化日志行里抽出某一个字段
服务器日志每一行都塞着时间戳、级别、请求 id 和一段消息。写一条 在请求 id 外面加括号分组的正则,把输出切到那个捕获组,你就能从 成千上万行里得到一列纯粹的 id。配合去重可以数出有多少个不同的 请求,或者用逗号连起来塞进 IN 子句,方便快速查库。
从凌乱的笔记里整理出干净的关键词或标签列表
话题标签、像 JIRA-1234 这样的工单号、产品 SKU 散落在会议记录和 工单里。一条短正则就能把它们全收上来,去重去掉重复,你就得到 一份整齐的列表,粘进追踪工具或表格。实时匹配数会在你定稿前告诉 你一共抓到了多少个。
在写进代码前先验证一条正则
在脚本或配置里信任一条正则之前,先粘一段真实样本,逐个分组看清 它到底捕获了什么。把完整匹配和每个编号分组并排看,能抓出那个 经典错误:分组刚好偏了一个字符。等提取出来的列表看着对了,再 放心地把同一条正则复制进代码。
常见踩坑
以为只会有第一个匹配。普通正则在第一个命中就停下,这也是工具强制全局模式的原因;如果你把正则复制进自己的代码,记得加上 g 标志,否则第一个之后的匹配会被悄悄漏掉。
把完整匹配和捕获组搞混。整条正则是第 0 组;括号才产生第 1、第 2 组等等。只想要域名或只想要 id,就在那一段外面加括号,并选对组号,而不是去读整段匹配。
让贪婪量词吞掉太多。像 <.+> 这样的正则跑在 HTML 上,会从这一行第一个尖括号一路匹配到最后一个,而不是一个标签一个标签地分。改用懒惰量词 <.+?> 或取反字符类 <[^>]+>,每个匹配才会卡得紧。
隐私说明
你粘贴的文本、写的正则,以及工具找到的每一个匹配,都是浏览器标签页 里的纯 JavaScript 在处理。没有任何东西被上传、记录或发往服务器。 有一点要留意:分享链接会把正则和选项写进查询字符串,所以把分享 链接粘到聊天里,对方服务器的访问日志会留下这些内容。较长的文本 正文不会写进网址,但只要涉及敏感内容,请优先用复制按钮而不是 分享链接。
常见问题
类似工具组合
做你这行的人, 还会一起用这些。