跳到主要内容

词频统计器:词频排行、关键词密度与 n-gram

把每个词和词组按出现次数排行,带关键词密度、停用词过滤和 n-gram 分析,全程浏览器本地

  • 本地处理
  • 分类 文本
  • 适合 把日常写作和运营里的重复清理工作省掉。
分析选项
词组长度
最小词长
总词数
0
唯一词数
0
句子数
0
段落数
0
字符数
0
非空字符
0
平均词长
0.0

输入文本后,词频排行会显示在这里。

100% 本地处理,你的文本不会离开浏览器。

这个工具能做什么

一个真正告诉你"这段文字在讲什么"而不仅仅是"有多长"的词频统计器。 把文章、演讲稿或初稿粘进来,它会把每个不同的词按出现次数排行,用关键词 密度百分比显示每个词在全文中的占比,并支持单词、二元词组、三元词组 (n-gram)分析,让你不只看到重复的词,还能看到重复的短语。内置停用词 过滤会去掉"的""和""了"这类语法词,让你真正的关键词浮到最上面,而不是 被功能词淹没。可以切换是否区分大小写、设定最小词长,还能用关键词密度查询 单独检测某个短语在全文中的密度,这正是当 SEO 插件提示"关键词堆砌" 时你需要的功能。中文用浏览器的 Intl.Segmenter 做分词(编程语言 → 编程 / 语言),而不是逐字拆散;英文按词边界干净切分,同时保留缩写和 连字符词。完整排行可导出 CSV 进表格,分享链接能带着原文重新打开。 所有计算都在你的浏览器里完成,你分析的文本绝不上传。

工具细节

输入
文本 + 数值
页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
输出
即时结果 + 复制 + 下载
结果区优先给出可操作结果,支持项会显示复制、下载或可视化预览。
隐私
浏览器本地处理
主工具逻辑未发现外部 API 调用,输入通常留在当前标签页内处理。
保存 / 分享
可分享链接状态
关键设置会进入 URL,复制链接后别人能复现同一组参数。
性能预算
首屏 JS ≤ 14 KB
没有声明 WASM 依赖,适合快速打开和移动端使用。
适用场景
文本 · 内容创作者
分类和职业标签用于推荐相关工具、组织内链,并帮助用户快速判断是否适合当前任务。

怎么用

  1. 1. 输入

    把内容粘贴或拖入工具面板。

  2. 2. 处理

    点击按钮,在浏览器内本地处理,文件不上传。

  3. 3. 复制 / 下载

    一键复制结果或下载到本地。

词频统计器 适合怎么用

适合在文本进入文档、CMS、表格或提示词前,先清理、对比、整理或提取。

适合文本任务

  • 把日常写作和运营里的重复清理工作省掉。
  • 让文本更容易对比、粘贴、发布或交给下一个工具。
  • 内容还没公开或比较私密时,先在本地处理。

文本检查项

  • 留意多余空格、重复行和被误删的标点。
  • 长文本先试前几行,再处理全文。
  • 先看预览,确认没问题再复制结果。

下一步可以接着做

这些入口会把当前任务接到更完整的工具链里。

  1. 1 字数统计 字数 / 字符 / 句子 / 段落 / 阅读时间一次看清,中英日韩混排支持,浏览器本地 打开
  2. 2 文本去重 去除重复行,可选忽略大小写或去首尾空白,显示去掉了多少行,纯浏览器本地 打开
  3. 3 文本排序 按字母 / 数字 / 长度 / 倒序排序文本行,可选去重和去空白,全程浏览器本地 打开

真实使用场景

  • 发文前检查博客是否关键词堆砌

    SEO 插件提示"关键词密度过高",却不告诉你具体数字。把草稿粘进来, 在密度查询里输入目标关键词,读百分比。如果"最佳跑鞋"显示 4.1%, 那就是堆砌了,搜索引擎和读者都看得出来。删掉几处,看着数字往 1%–2% 的舒适区掉,再复查一遍。把词组长度切到"二元词组",看看重复的 是完整短语,还是只是中心名词在自然变体里反复出现,后者读起来 自然得多。

  • 揪出自己写作里的口头禅

    每个写作者都有几个用过头的词:"其实""就""真的""赋能"。把一章 或一个月的 newsletter 文案粘进来,打开停用词过滤让语法词不抢信号, 扫一眼前 30 名。如果"其实"在 2000 字里出现了 47 次,那就是每 42 个词一次,读者能感觉到的语言习惯。现在你确切知道该在编辑器里 搜索替换哪些词,而且有次数能证明改前改后的差别。

  • 数演讲稿里的填充词

    把一场演讲或播客的文字稿导出来粘进这里,找"嗯""那个""你知道""就是说"。 用二元词组视图把"你知道"当一个整体抓出来。一个演讲者在 20 分钟里 说了 60 次"你知道",大约每 20 秒一次,可量化、可改进,而且用次数 指出来,比说"你说太多了"有说服力得多。把 CSV 和填充词排行第一名连同 它的密度交给演讲者,练习目标自己就出来了。

  • 从知识库文章里提取候选标签

    帮助中心文章需要 5–8 个标签,但你不想凭空编。把文章粘进来,过滤 停用词,把最小词长设成 2(让有意义的双字词留下,把单字虚词挡掉), 切到二元词组视图。排在前面的词组("密码重置""双重验证""账单周期") 就是你的标签候选,按它们在文章里的核心程度排好序。导出 CSV, 把前几行直接粘进 CMS 的标签字段。

  • 对比两版草稿是否跑题

    你重写了落地页,想确认新版仍然围绕同一个主题。分析 A 版导出 CSV, 再分析 B 版导出一次。在表格里对比两份前 20 名:如果"自动化"在 A 里排第一,到 B 里掉到第 14,而"仪表盘"爬了上来,说明你的重写悄悄 改变了页面在讲什么。配合文本对比工具看看到底是哪些句子挪动了重心, 再决定这个偏移是不是有意为之。

常见踩坑

  • 把关键词密度当成"要达到的目标"而不是"要守住的上限"。密度是堆砌警报,不是配额。为了凑到正好 2% 而硬塞关键词,写出来的文案比自然写作落在 1.3% 还糟。用这个数字发现用过头了,然后回到为读者写作。

  • 不开停用词过滤,然后得出"the/的 是我的头号关键词"。当然是,功能词在任何文本里都占主导。如果你的前几名是"的 / 了 / 是 / 在",把过滤打开;那张表刚才给你看的是语法,不是主题。

  • 在长度不同的文档之间比原始次数,而不是比密度。一个词在 10000 字的文章里出现 50 次(0.5%),远不如在 1000 字的短文里出现 50 次(5%)突出。对比两份文本时,看密度那一列,别看次数那一列。

隐私说明

分词、词频排行、关键词密度、文档统计和 CSV 导出,全部是浏览器标签页里 跑的纯 JavaScript。你分析的文本绝不上传、绝不记录,也没有任何打点记录 你粘了什么。唯一要留意的隐私点:分享链接会把文本前约 1200 个字符编码 进 URL,所以如果你把涉密文案的"分享链接"粘到 Slack 或邮件里,对方 服务器的访问日志会看到这段文本。私密草稿请手动复制文本或 CSV,不要 分享 URL。

常见问题

类似工具组合

做你这行的人, 还会一起用这些。

Made by Toolora · 100% client-side · Updated 2026-06-13