社交账号提取:从文本里抠出所有 @账号并整理成账号库
把评论、私信、合作记录里的 @社交账号一次性提取出来,去重、统计被提及次数、整理成可交接的账号库,适合社媒运营和网红合作管理。
社交账号提取:把散落的 @账号收成一张干净账号库
做社媒运营的人都遇到过这种场面:一个活动跑下来,评论区、私信、内部群、合作邮件里全是 @某某账号,有人手抄进表格,有人靠 Ctrl+F 一个个找。等到要统计谁被 @得最多、要把网红账号整理成合作库的时候,才发现这些散落的账号根本对不齐,大小写不统一,还混着邮箱里的 @ 和价格里的 @9.99。
这件事其实不该靠人眼。只要文本里有 @username 这种结构,机器抠得比人快也比人准。
@账号长什么样,机器怎么认
社媒账号的通用格式很固定:一个 @ 开头,后面跟字母、数字和下划线,比如 @brand_official、@li_lei2026、@toolora。提取器按这个模式扫一遍文本,就能把所有命中的 token 挑出来,同时把它们前后的评论正文、个人主页链接、一整段废话全部丢掉。
需要注意的边界:邮箱地址里的 @ 不是账号,价格写法 @9.99 也不是,这些会被标成无效项。把无效项保留下来而不是直接扔掉,是为了让你一眼看清正则误抓了什么,好决定从提及列表里滤掉哪些。
一个真实的提取例子
假设你从一条活动复盘里复制了这么一段文字:
感谢 @brand_official 和 @li_lei2026 的转发,
@brand_official 这次内容做得很好,
联系邮箱 ops@toolora.info,预算 @9.99 起,
合作方还有 @toolora 和 @design_studio。
把它粘进 社交账号提取器,输出的去重列表是:
@brand_official
@li_lei2026
@toolora
@design_studio
ops@toolora.info 里的 @ 和 @9.99 被标成无效,不进最终列表;@brand_official 出现了两次,去重后只留一条。整张表还带着行号和校验原因,需要回原文核对时,顺着行号就找回去了。
统计被 @提及:谁是高频账号
整理网红合作的人最关心一个数字:这一波里谁被点名最多。提取器保留每个账号的原始出现位置,你既可以只要去重后的唯一值,也可以把全部命中带出来排序,从而看出 @brand_official 被提了几次、哪个合作方账号反复出现。这比人工数靠谱得多,也不会漏。
如果你的源数据本身就是一份杂乱的账号清单,只想做去重和合并,可以直接用 社媒账号去重器,它专门处理"同一个账号写了好几遍、大小写还不一样"这类问题。
整理成可交接的账号库
提取出来只是第一步,真正能用的是一份能交给 CRM、工单系统或脚本的产物。这个工具支持在逐行、CSV、JSON、Markdown、SQL IN 和 TypeScript union 之间切换:
- 给运营同事:导出 CSV,直接进表格或合作方台账。
- 给开发同事:导出 JSON 或 SQL IN,省掉手工加引号、漏逗号的麻烦。
- 给文档:导出 Markdown,贴进复盘文档就是一张现成清单。
我自己整理上一季度的网红合作库时,先把三个群的聊天记录和两封合作邮件全粘进去,去重后从 217 条原始提及收敛到 48 个唯一账号,再导出 CSV 交接,整个过程没有一条是手抄的。最让我省心的是行号:有个账号拼写存疑,我顺着行号回原文一看,是对方自己打错了 @,当场就改了。
一点使用提醒
账号格式正确不代表这个账号真实存在,提取器只负责把文本里符合 @账号结构的内容抠出来并校验格式,不做真实性核验。另外从网页复制来的文本常带隐藏空白,导入前最好先规范化再去重,否则两个看起来一样的账号可能因为一个不可见空格被当成两条。
所有解析、去重、导出都在浏览器本地完成,聊天记录、合作名单这类敏感文本不会发到服务器,适合直接处理内部数据。
把散落在评论、私信、邮件里的 @账号收成一张干净账号库,本来就是几秒钟的事,不该再占用一个下午。
Made by Toolora · Updated 2026-06-13