粘进 HTML 源码,一键拿到纯文本。块级标签转换行、还原实体、保留指定标签、删干净 script,全在浏览器本地跑。
- 本地处理
- 分类 文本
- 适合 把日常写作和运营里的重复清理工作省掉。
这个工具能做什么
把 HTML 源码变成干净纯文本。从网页另存的源码、邮件模板、富文本编辑器 导出的内容里,标签往往比正文还多,直接复制还会带一堆 &、 这类乱码。这个工具去掉所有标签,只留文字,并把 p、div、li、h1 到 h6、 br、tr 这类块级标签换成换行,段落结构不被压成一坨。HTML 实体能还原成 正常字符,& 变回 &、' 变回单引号、 变回空格。script 和 style 里的代码连同标签一起删,不会漏到正文。想保留 b、i、a 这种标签也 行,填进白名单即可。多余空行可一键折叠。粘进去就出结果,带字符数,一键 复制。全程在你浏览器里算,内容不上传任何服务器。
工具细节
- 输入
- 文本 + 数值 + 结构化内容
- 页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
- 输出
- 即时结果 + 复制
- 结果区优先给出可操作结果,支持项会显示复制、下载或可视化预览。
- 隐私
- 浏览器本地处理
- 主工具逻辑未发现外部 API 调用,输入通常留在当前标签页内处理。
- 保存 / 分享
- 本地保存偏好
- 偏好、历史或草稿保存在本机浏览器,不需要账号。
- 性能预算
- 首屏 JS ≤ 9 KB
- 没有声明 WASM 依赖,适合快速打开和移动端使用。
- 适用场景
- 文本 · 程序员
- 分类和职业标签用于推荐相关工具、组织内链,并帮助用户快速判断是否适合当前任务。
怎么用
-
1. 输入
把内容粘贴或拖入工具面板。
-
2. 处理
点击按钮,在浏览器内本地处理,文件不上传。
-
3. 复制 / 下载
一键复制结果或下载到本地。
HTML 标签去除工具 适合怎么用
适合在文本进入文档、CMS、表格或提示词前,先清理、对比、整理或提取。
适合文本任务
- 把日常写作和运营里的重复清理工作省掉。
- 让文本更容易对比、粘贴、发布或交给下一个工具。
- 内容还没公开或比较私密时,先在本地处理。
文本检查项
- 留意多余空格、重复行和被误删的标点。
- 长文本先试前几行,再处理全文。
- 先看预览,确认没问题再复制结果。
下一步可以接着做
这些入口会把当前任务接到更完整的工具链里。
真实使用场景
把抓来的网页正文洗成纯文本语料
做爬虫或写脚本时,抓回的页面满是 div、span、内联样式,还夹着 script 里的统计代码。粘进来,块级标签转换行开着,script 内容 删掉,出来就是带段落的干净正文,直接喂给搜索索引或大模型, 不用自己写一堆正则去清洗。
富文本编辑器导出的内容降级成纯文字
公众号、Notion、Word 在线版复制出来的文字常带一层 HTML,粘进 别的纯文本框就一堆乱码。先在这里去掉标签、还原 和 &, 再粘到代码注释、聊天框或终端里,排版不会炸。
邮件模板里抠出可读文案
营销邮件的 HTML 模板嵌套很深,想看真正发出去的文案得在标签堆里 找。整段粘进来,保留段落换行,标题和正文分行排好,一眼看清这封 邮件到底写了什么,方便审稿或改文案。
给文字做字数统计前先去格式
带标签的内容直接数字数会把 <p>、class 名都算进去。先用这里转成 纯文本,实体也还原成单个字符,再去 word-counter 数,中文按字、 英文按词都准,不被标签污染。
常见踩坑
关掉「块级标签转换行」去处理整页 HTML,结果所有段落、标题、列表挤成一长行,读起来比原码还累。处理网页正文时把这个开关留着,只有要把文本拼成单行喂程序时才关。
忘了开「解码实体」,纯文本里留着 &、'、 这些转义。这些不是正文的一部分,是 HTML 的写法,不还原的话粘到别处会被当成普通字符显示出来。
以为去标签会顺手删掉 script 里的代码,用别的工具结果一长串 JavaScript 漏进正文。要确认工具是连 script、style 的内容一起删,不只是删那对标签。这里默认就是整块删掉的。
隐私说明
去标签、解码实体、折叠空白这些都是浏览器标签页里跑的纯 JavaScript, 用的是字符串和正则,不碰任何服务器。你粘进来的 HTML 和导出的纯文本 都不离开页面,也不记录。要注意的是这个工具不接分享链接:HTML 内容 可能很长又常含隐私信息,不写进网址,所以刷新页面内容会清空。需要留存 就用复制按钮把结果存到别处。
常见问题
类似工具组合
做你这行的人, 还会一起用这些。