跟字数统计有什么区别?

字数统计回答的是"这段文字有多长":总词数、字符数、阅读时间。这个工具回答的是"这段文字在讲什么":把每个词按出现次数排行、算出关键词密度(每个词占全文的比例)、找出重复的二元和三元词组。要凑字数用字数统计;要看哪些词和短语占主导,用这个。

什么是停用词?为什么要过滤?

停用词是出现频率极高但几乎没有主题含义的语法词:英文的 "the""and""of",中文的"的""了""是"。不过滤的话它们永远霸榜,把你真正关心的词压在下面。打开过滤就把它们去掉,让真关键词浮上来。如果你恰恰想研究功能词的用法(比如改稿时检查连接词是否过多),就把它关掉。

SEO 的关键词密度多少合适?

没有魔法数字,但多数 SEO 从业者会把主关键词控制在全页面约 0.5%–2.5%。超过约 3% 在读者和搜索引擎看来都像堆砌,可能反而伤排名。用这里的关键词密度查询检测某个短语:输进去、看百分比、再调整。密度是个健全性检查,不是用来钻空子的指标,永远先为人写作。

中文没有空格,它怎么分词?

中文没有空格,所以这个工具用浏览器内置的 Intl.Segmenter 按词粒度切分,把"编程语言"分成"编程"和"语言",而不是五个孤立的字。在极少数不支持 Segmenter 的浏览器上,它会退回逐字计数,仍能给出有用的字频视图。中英混排会按语言段分别处理。

我的文本会被上传吗?

不会。分词、排行、密度计算和 CSV 导出全部在浏览器标签页里用 JavaScript 跑。不发任何服务器,也不记录你分析了什么。唯一要注意的:分享链接会把文本前一部分编码进 URL,所以涉密文案不要用分享链接,手动复制文本更稳妥。

发文前检查博客是否关键词堆砌

SEO 插件提示"关键词密度过高",却不告诉你具体数字。把草稿粘进来, 在密度查询里输入目标关键词,读百分比。如果"最佳跑鞋"显示 4.1%, 那就是堆砌了,搜索引擎和读者都看得出来。删掉几处,看着数字往 1%–2% 的舒适区掉,再复查一遍。把词组长度切到"二元词组",看看重复的是完整短语,还是只是中心名词在自然变体里反复出现,后者读起来自然得多。

揪出自己写作里的口头禅

每个写作者都有几个用过头的词:"其实""就""真的""赋能"。把一章或一个月的 newsletter 文案粘进来,打开停用词过滤让语法词不抢信号, 扫一眼前 30 名。如果"其实"在 2000 字里出现了 47 次,那就是每 42 个词一次,读者能感觉到的语言习惯。现在你确切知道该在编辑器里搜索替换哪些词,而且有次数能证明改前改后的差别。

数演讲稿里的填充词

把一场演讲或播客的文字稿导出来粘进这里,找"嗯""那个""你知道""就是说"。用二元词组视图把"你知道"当一个整体抓出来。一个演讲者在 20 分钟里说了 60 次"你知道",大约每 20 秒一次,可量化、可改进,而且用次数指出来,比说"你说太多了"有说服力得多。把 CSV 和填充词排行第一名连同它的密度交给演讲者,练习目标自己就出来了。

从知识库文章里提取候选标签

帮助中心文章需要 5–8 个标签,但你不想凭空编。把文章粘进来,过滤停用词,把最小词长设成 2(让有意义的双字词留下,把单字虚词挡掉), 切到二元词组视图。排在前面的词组("密码重置""双重验证""账单周期") 就是你的标签候选,按它们在文章里的核心程度排好序。导出 CSV, 把前几行直接粘进 CMS 的标签字段。

对比两版草稿是否跑题

你重写了落地页,想确认新版仍然围绕同一个主题。分析 A 版导出 CSV, 再分析 B 版导出一次。在表格里对比两份前 20 名:如果"自动化"在 A 里排第一,到 B 里掉到第 14,而"仪表盘"爬了上来,说明你的重写悄悄改变了页面在讲什么。配合文本对比工具看看到底是哪些句子挪动了重心, 再决定这个偏移是不是有意为之。

词频统计器:词频排行、关键词密度与 n-gram

把每个词和词组按出现次数排行,带关键词密度、停用词过滤和 n-gram 分析,全程浏览器本地

本地处理
分类文本
适合把日常写作和运营里的重复清理工作省掉。

待分析文本

分析选项

词组长度

最小词长

过滤停用词区分大小写

总词数

唯一词数

句子数

段落数

字符数

非空字符

平均词长

0.0

关键词密度查询

输入文本后,词频排行会显示在这里。

100% 本地处理,你的文本不会离开浏览器。

这个工具能做什么

一个真正告诉你"这段文字在讲什么"而不仅仅是"有多长"的词频统计器。把文章、演讲稿或初稿粘进来,它会把每个不同的词按出现次数排行,用关键词密度百分比显示每个词在全文中的占比,并支持单词、二元词组、三元词组 (n-gram)分析,让你不只看到重复的词,还能看到重复的短语。内置停用词过滤会去掉"的""和""了"这类语法词,让你真正的关键词浮到最上面,而不是被功能词淹没。可以切换是否区分大小写、设定最小词长,还能用关键词密度查询单独检测某个短语在全文中的密度,这正是当 SEO 插件提示"关键词堆砌" 时你需要的功能。中文用浏览器的 Intl.Segmenter 做分词(编程语言 → 编程 / 语言),而不是逐字拆散;英文按词边界干净切分,同时保留缩写和连字符词。完整排行可导出 CSV 进表格,分享链接能带着原文重新打开。所有计算都在你的浏览器里完成,你分析的文本绝不上传。

工具细节

输入: 文本 + 数值; 页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
输出: 即时结果 + 复制 + 下载; 结果区优先给出可操作结果，支持项会显示复制、下载或可视化预览。
隐私: 浏览器本地处理; 主工具逻辑未发现外部 API 调用，输入通常留在当前标签页内处理。
保存 / 分享: 可分享链接状态; 关键设置会进入 URL，复制链接后别人能复现同一组参数。
性能预算: 首屏 JS ≤ 14 KB; 没有声明 WASM 依赖，适合快速打开和移动端使用。
适用场景: 文本 · 内容创作者; 分类和职业标签用于推荐相关工具、组织内链，并帮助用户快速判断是否适合当前任务。

怎么用

1. 输入

把内容粘贴或拖入工具面板。
2. 处理

点击按钮,在浏览器内本地处理,文件不上传。
3. 复制 / 下载

一键复制结果或下载到本地。

词频统计器适合怎么用

适合在文本进入文档、CMS、表格或提示词前,先清理、对比、整理或提取。

适合文本任务

把日常写作和运营里的重复清理工作省掉。
让文本更容易对比、粘贴、发布或交给下一个工具。
内容还没公开或比较私密时,先在本地处理。

文本检查项

留意多余空格、重复行和被误删的标点。
长文本先试前几行,再处理全文。
先看预览,确认没问题再复制结果。

下一步可以接着做

这些入口会把当前任务接到更完整的工具链里。

真实使用场景

发文前检查博客是否关键词堆砌
SEO 插件提示"关键词密度过高",却不告诉你具体数字。把草稿粘进来, 在密度查询里输入目标关键词,读百分比。如果"最佳跑鞋"显示 4.1%, 那就是堆砌了,搜索引擎和读者都看得出来。删掉几处,看着数字往 1%–2% 的舒适区掉,再复查一遍。把词组长度切到"二元词组",看看重复的是完整短语,还是只是中心名词在自然变体里反复出现,后者读起来自然得多。
揪出自己写作里的口头禅
每个写作者都有几个用过头的词:"其实""就""真的""赋能"。把一章或一个月的 newsletter 文案粘进来,打开停用词过滤让语法词不抢信号, 扫一眼前 30 名。如果"其实"在 2000 字里出现了 47 次,那就是每 42 个词一次,读者能感觉到的语言习惯。现在你确切知道该在编辑器里搜索替换哪些词,而且有次数能证明改前改后的差别。
数演讲稿里的填充词
把一场演讲或播客的文字稿导出来粘进这里,找"嗯""那个""你知道""就是说"。用二元词组视图把"你知道"当一个整体抓出来。一个演讲者在 20 分钟里说了 60 次"你知道",大约每 20 秒一次,可量化、可改进,而且用次数指出来,比说"你说太多了"有说服力得多。把 CSV 和填充词排行第一名连同它的密度交给演讲者,练习目标自己就出来了。
从知识库文章里提取候选标签
帮助中心文章需要 5–8 个标签,但你不想凭空编。把文章粘进来,过滤停用词,把最小词长设成 2(让有意义的双字词留下,把单字虚词挡掉), 切到二元词组视图。排在前面的词组("密码重置""双重验证""账单周期") 就是你的标签候选,按它们在文章里的核心程度排好序。导出 CSV, 把前几行直接粘进 CMS 的标签字段。
对比两版草稿是否跑题
你重写了落地页,想确认新版仍然围绕同一个主题。分析 A 版导出 CSV, 再分析 B 版导出一次。在表格里对比两份前 20 名:如果"自动化"在 A 里排第一,到 B 里掉到第 14,而"仪表盘"爬了上来,说明你的重写悄悄改变了页面在讲什么。配合文本对比工具看看到底是哪些句子挪动了重心, 再决定这个偏移是不是有意为之。

常见踩坑

把关键词密度当成"要达到的目标"而不是"要守住的上限"。密度是堆砌警报,不是配额。为了凑到正好 2% 而硬塞关键词,写出来的文案比自然写作落在 1.3% 还糟。用这个数字发现用过头了,然后回到为读者写作。
不开停用词过滤,然后得出"the/的是我的头号关键词"。当然是,功能词在任何文本里都占主导。如果你的前几名是"的 / 了 / 是 / 在",把过滤打开;那张表刚才给你看的是语法,不是主题。
在长度不同的文档之间比原始次数,而不是比密度。一个词在 10000 字的文章里出现 50 次(0.5%),远不如在 1000 字的短文里出现 50 次(5%)突出。对比两份文本时,看密度那一列,别看次数那一列。

隐私说明

分词、词频排行、关键词密度、文档统计和 CSV 导出,全部是浏览器标签页里跑的纯 JavaScript。你分析的文本绝不上传、绝不记录,也没有任何打点记录你粘了什么。唯一要留意的隐私点:分享链接会把文本前约 1200 个字符编码进 URL,所以如果你把涉密文案的"分享链接"粘到 Slack 或邮件里,对方服务器的访问日志会看到这段文本。私密草稿请手动复制文本或 CSV,不要分享 URL。

常见问题

类似工具组合

做你这行的人, 还会一起用这些。

看这个职业的全部工具

词频统计器:词频排行、关键词密度与 n-gram

这个工具能做什么

工具细节

怎么用

1. 输入

2. 处理

3. 复制 / 下载

词频统计器 适合怎么用

适合文本任务

文本检查项

下一步可以接着做

真实使用场景

发文前检查博客是否关键词堆砌

揪出自己写作里的口头禅

数演讲稿里的填充词

从知识库文章里提取候选标签

对比两版草稿是否跑题

常见踩坑

隐私说明

常见问题

字数统计

文本去重

文本排序

大小写转换

文本对比

A1Z26 字母数字密码

中医穴位查询

文本加行号

全角美学文字生成器

AI Eval 计划生成器

AI 模型对比

AI Token 计数器

词频统计器适合怎么用