Markdown 转纯文本:去掉格式记号只留可读文字
把 Markdown 里的井号、星号、链接语法全部剥掉,只留下能读的文字。讲清楚什么时候要转纯文本,怎么保留段落结构,附一段真实输入输出例子。
Markdown 转纯文本:去掉格式记号只留可读文字
Markdown 写起来顺手,但它本质上是一套记号。井号代表标题,星号代表粗体斜体,方括号加圆括号代表链接。这些记号在支持 Markdown 的编辑器里会被渲染成排版效果,可一旦把原文粘到不认识这套语法的地方,记号就原样露出来了,正文里全是 #、** 和 [ ]( ),看着像坏了。
把 Markdown 转成纯文本,做的就是一件事:把记号拿掉,把文字留下。标题去掉前面的井号,粗体斜体去掉两边的星号,链接只保留括号里的文字。结果是一段不带任何标签的干净文字,放进任何地方都不会露馅。
什么时候需要转纯文本
最常见的场景是粘贴。你在 Markdown 编辑器里写好发布说明或一段笔记,要发到 Gmail、Word、微信或者某个备注框,这些地方不渲染 Markdown,星号和井号就会原样留在正文里。先转一遍纯文本,粘进去就是干净的。
第二个场景是只收纯文本的字段。CRM 备注、工单系统、老旧 CMS 的输入框、应用商店的简介框,很多地方只接受纯文本,你把带格式的内容塞进去,符号会全部暴露。
第三个场景是数字数。直接对原始 Markdown 数词,井号、星号和网址串都会被算进去,把数字撑虚,而这些东西读者根本看不到。先转成纯文本再数,字数才是真正会被读到的量,卡摘要长度或者控 meta description 预算时很有用。这一步可以接着用 字数统计 把结果数清楚。
第四个场景是给语音合成或读屏软件备稿。引擎念原始 Markdown 会把井号念成"井号",把网址一个字母一个字母拼出来,稿子听着全是标点。去掉格式后,念起来才像正常说话。
各种记号分别怎么处理
不同记号有不同的去法,理清楚才知道结果会长什么样。
标题处理的是行首一到六个井号,只去井号,文字留着。粗体和斜体去掉两边的星号或下划线,删除线去掉波浪号。带下划线的写法,比如 user_id,不会被当成斜体拆开,代码味的文字也保得住。
链接有两种留法。只留文字时,[价格页](网址) 变成 价格页,放进邮件读着顺;连网址一起留时,变成 价格页 (网址),做引用清单时还看得到去向。
行内代码去掉反引号但原样保留代码本身,代码里的井号星号不会被误当成格式。围栏代码块可以选择保留内容,也可以整段删掉,只想要 README 里的说明文字不要代码片段时,删掉很省事。
列表的点和编号去掉,引用前面的尖括号去掉,水平线删掉,表格压成对齐的几列。混进来的 HTML 标签和实体也清干净。
保留段落结构
去格式不等于把所有结构都压平。换行和空行会保留,所以段落和段落之间的分隔还在,读起来不会糊成一坨。
列表和表格可以自己决定结构留不留。列表想留一个干净的圆点也行,想彻底变成纯文本行也行。表格可以压成对齐的几列,保住行列的对应关系,而不是一堆竖线挤在一起。这样转出来的不是一团碎字,而是一篇能读的文章。
一段真实的输入输出
输入是一段典型的 Markdown:
## 季度复盘
**核心结论**:本季新增工具 12 个,详见 [工具列表](https://toolora.info/tools)。
- 收录率提升到 22%
- 平均 *Lighthouse* 分 96
转成纯文本后,只留文字这一档,结果是:
季度复盘
核心结论:本季新增工具 12 个,详见 工具列表。
收录率提升到 22%
平均 Lighthouse 分 96
井号没了,星号没了,链接只剩文字"工具列表",列表的横杠也去掉了,但标题、正文、两条要点之间的分行都还在。这段文字现在可以直接粘进任何邮件或备注框。
我自己的用法
我写工具说明和发布日志习惯用 Markdown,因为打字快。但要把这些内容同步到工单或者发给同事时,带格式的原文就不合适了。我的固定流程是:在编辑器里写完,丢进 Markdown 转纯文本,链接选只留文字,代码块按需删掉,复制右边的结果,再粘到目的地。整个过程不到十秒,比以前一个一个手删星号省心太多。反过来,如果我拿到的是一段纯文本想补回格式,会用 HTML 转 Markdown 之类的工具走相反的路。
转换全程在浏览器本地跑,不上传也不登录,写了一半的 **粗体 或者缺半边的链接都不会让它出错。涉及保密的内容,用复制按钮取文字就好,别去分享带输入的网址。
Made by Toolora · Updated 2026-06-13