把每个词和词组按出现次数排行,带关键词密度、停用词过滤和 n-gram 分析,全程浏览器本地
- 本地处理
- 分类 文本
- 适合 把日常写作和运营里的重复清理工作省掉。
输入文本后,词频排行会显示在这里。
100% 本地处理,你的文本不会离开浏览器。这个工具能做什么
一个真正告诉你"这段文字在讲什么"而不仅仅是"有多长"的词频统计器。 把文章、演讲稿或初稿粘进来,它会把每个不同的词按出现次数排行,用关键词 密度百分比显示每个词在全文中的占比,并支持单词、二元词组、三元词组 (n-gram)分析,让你不只看到重复的词,还能看到重复的短语。内置停用词 过滤会去掉"的""和""了"这类语法词,让你真正的关键词浮到最上面,而不是 被功能词淹没。可以切换是否区分大小写、设定最小词长,还能用关键词密度查询 单独检测某个短语在全文中的密度,这正是当 SEO 插件提示"关键词堆砌" 时你需要的功能。中文用浏览器的 Intl.Segmenter 做分词(编程语言 → 编程 / 语言),而不是逐字拆散;英文按词边界干净切分,同时保留缩写和 连字符词。完整排行可导出 CSV 进表格,分享链接能带着原文重新打开。 所有计算都在你的浏览器里完成,你分析的文本绝不上传。
工具细节
- 输入
- 文本 + 数值
- 页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
- 输出
- 即时结果 + 复制 + 下载
- 结果区优先给出可操作结果,支持项会显示复制、下载或可视化预览。
- 隐私
- 浏览器本地处理
- 主工具逻辑未发现外部 API 调用,输入通常留在当前标签页内处理。
- 保存 / 分享
- 可分享链接状态
- 关键设置会进入 URL,复制链接后别人能复现同一组参数。
- 性能预算
- 首屏 JS ≤ 14 KB
- 没有声明 WASM 依赖,适合快速打开和移动端使用。
- 适用场景
- 文本 · 内容创作者
- 分类和职业标签用于推荐相关工具、组织内链,并帮助用户快速判断是否适合当前任务。
怎么用
-
1. 输入
把内容粘贴或拖入工具面板。
-
2. 处理
点击按钮,在浏览器内本地处理,文件不上传。
-
3. 复制 / 下载
一键复制结果或下载到本地。
词频统计器 适合怎么用
适合在文本进入文档、CMS、表格或提示词前,先清理、对比、整理或提取。
适合文本任务
- 把日常写作和运营里的重复清理工作省掉。
- 让文本更容易对比、粘贴、发布或交给下一个工具。
- 内容还没公开或比较私密时,先在本地处理。
文本检查项
- 留意多余空格、重复行和被误删的标点。
- 长文本先试前几行,再处理全文。
- 先看预览,确认没问题再复制结果。
下一步可以接着做
这些入口会把当前任务接到更完整的工具链里。
真实使用场景
发文前检查博客是否关键词堆砌
SEO 插件提示"关键词密度过高",却不告诉你具体数字。把草稿粘进来, 在密度查询里输入目标关键词,读百分比。如果"最佳跑鞋"显示 4.1%, 那就是堆砌了,搜索引擎和读者都看得出来。删掉几处,看着数字往 1%–2% 的舒适区掉,再复查一遍。把词组长度切到"二元词组",看看重复的 是完整短语,还是只是中心名词在自然变体里反复出现,后者读起来 自然得多。
揪出自己写作里的口头禅
每个写作者都有几个用过头的词:"其实""就""真的""赋能"。把一章 或一个月的 newsletter 文案粘进来,打开停用词过滤让语法词不抢信号, 扫一眼前 30 名。如果"其实"在 2000 字里出现了 47 次,那就是每 42 个词一次,读者能感觉到的语言习惯。现在你确切知道该在编辑器里 搜索替换哪些词,而且有次数能证明改前改后的差别。
数演讲稿里的填充词
把一场演讲或播客的文字稿导出来粘进这里,找"嗯""那个""你知道""就是说"。 用二元词组视图把"你知道"当一个整体抓出来。一个演讲者在 20 分钟里 说了 60 次"你知道",大约每 20 秒一次,可量化、可改进,而且用次数 指出来,比说"你说太多了"有说服力得多。把 CSV 和填充词排行第一名连同 它的密度交给演讲者,练习目标自己就出来了。
从知识库文章里提取候选标签
帮助中心文章需要 5–8 个标签,但你不想凭空编。把文章粘进来,过滤 停用词,把最小词长设成 2(让有意义的双字词留下,把单字虚词挡掉), 切到二元词组视图。排在前面的词组("密码重置""双重验证""账单周期") 就是你的标签候选,按它们在文章里的核心程度排好序。导出 CSV, 把前几行直接粘进 CMS 的标签字段。
对比两版草稿是否跑题
你重写了落地页,想确认新版仍然围绕同一个主题。分析 A 版导出 CSV, 再分析 B 版导出一次。在表格里对比两份前 20 名:如果"自动化"在 A 里排第一,到 B 里掉到第 14,而"仪表盘"爬了上来,说明你的重写悄悄 改变了页面在讲什么。配合文本对比工具看看到底是哪些句子挪动了重心, 再决定这个偏移是不是有意为之。
常见踩坑
把关键词密度当成"要达到的目标"而不是"要守住的上限"。密度是堆砌警报,不是配额。为了凑到正好 2% 而硬塞关键词,写出来的文案比自然写作落在 1.3% 还糟。用这个数字发现用过头了,然后回到为读者写作。
不开停用词过滤,然后得出"the/的 是我的头号关键词"。当然是,功能词在任何文本里都占主导。如果你的前几名是"的 / 了 / 是 / 在",把过滤打开;那张表刚才给你看的是语法,不是主题。
在长度不同的文档之间比原始次数,而不是比密度。一个词在 10000 字的文章里出现 50 次(0.5%),远不如在 1000 字的短文里出现 50 次(5%)突出。对比两份文本时,看密度那一列,别看次数那一列。
隐私说明
分词、词频排行、关键词密度、文档统计和 CSV 导出,全部是浏览器标签页里 跑的纯 JavaScript。你分析的文本绝不上传、绝不记录,也没有任何打点记录 你粘了什么。唯一要留意的隐私点:分享链接会把文本前约 1200 个字符编码 进 URL,所以如果你把涉密文案的"分享链接"粘到 Slack 或邮件里,对方 服务器的访问日志会看到这段文本。私密草稿请手动复制文本或 CSV,不要 分享 URL。
常见问题
类似工具组合
做你这行的人, 还会一起用这些。