NFC、NFD、NFKC、NFKD 有什么区别？

NFC 会在 Unicode 允许时把标准等价的序列合成起来，例如 e 加组合尖音符可以合成单个码点 é。NFD 则反过来，把标准预合成字符拆成基字符加组合标记，适合检查音符来源，或为后续“去音符”处理做准备。 NFKC 和 NFKD 额外加入兼容折叠。它们可能把全角Ａ变成 A，把带圈 ① 变成 1，把 ﬁ 连字变成 fi，所以很适合做搜索键和去重键；但它们也会丢掉一部分外观层面的差异，原文展示通常不要只保留 NFKC 后的结果。

为什么两个看起来一样的字符串比较结果不同？

Unicode 允许同一个可见文本有多种合法编码。例如 é 可以存成 U+00E9，也可以存成 U+0065 后面跟 U+0301；不同编辑器、操作系统和复制来源会选择不同形式。浏览器显示时它们看起来一样，但按字节或按码点比较时就是两段不同字符串。把两边先规范到同一种形式，存储通常用 NFC，搜索键常用 NFKC；需要解释差异时，再看逐码点表格就能定位是哪一个字符不同。

工具怎样处理无效或畸形 Unicode？

JavaScript 字符串底层是 UTF-16，所以常见的畸形输入是孤立的高代理项或低代理项，也就是一个 emoji 或星形平面字符被截断了一半。工具不会抛异常，而是把这一行标为畸形，显示对应的代理码元，并继续检查后面的文本。这对排查损坏日志、截断的数据库导出、或被错误切片的转义数据很有用。规范化结果仍会显示，但警告会提醒你：这段源文本在成为生产键之前应该先修复。

规范化会删除重音符号或不可见字符吗？

不会，规范化不等于删除。NFD 和 NFKD 会把重音暴露成独立的组合标记码点，但不会自动删掉它们；如果目标是去音符，还需要在分解后另外过滤组合标记。零宽连接符、方向控制符等不可见格式字符也不会因为 NFC 或 NFD 自动消失。你可以先用检查表找到它们的准确 U+ 编号，再在自己的清洗流程里有选择地删除。

粘贴的文本会上传或保存吗？

不会。码点拆解、字符名查询、类别识别和规范化都在当前浏览器标签页里完成，只用内置 JavaScript API 和少量本地查表，组件不请求外部 API。短文本会写进分享 URL，方便别人打开链接看到同一视图。超大输入不会写入 URL；包含私人姓名、令牌、消息或客户数据的内容，也不建议做成可分享链接。

解释两个复制来的用户名为什么不相等

把两个值粘进来，对照逐码点表格。问题可能是分解音符、零宽连接符，或一个看起来像拉丁字母的西里尔字符。规范到 NFC 或 NFKC 后，再复制你希望用户名校验采用的形式。

为搜索索引和去重准备文本

导入 CSV 列之前，把可疑姓名或商品名跑一遍 NFKC 并查看变化。全角字母、带圈数字和连字会折叠成可搜索的等价形式，表格会显示到底是哪几个原始码点造成了错配。

排查损坏 emoji 或畸形导出

如果一个 emoji 被从中间截断，检查器会报告孤立 UTF-16 代理项，而不是把问题藏起来。你仍然可以查看附近字符，再决定修复、丢弃，还是重新导出这一行。

Unicode 检查与规范化: 码点、字符名、类别、NFC、NFD、NFKC、NFKD

在浏览器本地查看码点、字符名、类别、UTF-8 字节，并把文本转换成 NFC、NFD、NFKC 或 NFKD。

本地处理
分类文本
适合把日常写作和运营里的重复清理工作省掉。

输入文本

粘贴文本后即可检查码点，并比较 NFC、NFD、NFKC、NFKD 规范化结果。

UTF-16 码元0

码点0

UTF-8 字节0

畸形0

输出形式

标准合成：Unicode 有单一码点时，把基字符和组合标记合成起来。

规范化结果

码点检查表

0 码点

还没有可显示的码点。

这个工具能做什么

一个面向开发者、编辑和本地化团队的纯浏览器 Unicode 检查与规范化工具。粘贴文本后，可以逐码点查看 U+ 编号、十进制值、尽可能精确的字符名、通用类别、Unicode 区块、UTF-8 字节、UTF-16 码元、JavaScript 转义和 HTML 实体。同一段输入会同时转换成 NFC、NFD、NFKC 和 NFKD，方便你比较组合音符、分解后的附加标记、全角字符、连字以及其他兼容字符，并复制真正需要的那个结果。

工具会把畸形 UTF-16 里的孤立代理项标出来，而不是让页面崩掉；超大粘贴文本不会写进分享 URL；逐字符表格也会限制展示行数以保持响应速度。整个过程不请求外部 API，适合排查不可见字符、搜索与去重错配、CSV 导入文本、PDF 复制噪声、用户名、slug 和多语言内容流水线里的编码问题。

工具细节

输入: 文本; 页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
输出: 即时结果 + 复制; 结果区优先给出可操作结果，支持项会显示复制、下载或可视化预览。
隐私: 浏览器本地处理; 主工具逻辑未发现外部 API 调用，输入通常留在当前标签页内处理。
保存 / 分享: 可分享链接状态; 关键设置会进入 URL，复制链接后别人能复现同一组参数。
性能预算: 首屏 JS ≤ 24 KB; 没有声明 WASM 依赖，适合快速打开和移动端使用。
适用场景: 文本 · 程序员; 分类和职业标签用于推荐相关工具、组织内链，并帮助用户快速判断是否适合当前任务。

怎么用

1. 输入

把内容粘贴或拖入工具面板。
2. 处理

点击按钮,在浏览器内本地处理,文件不上传。
3. 复制 / 下载

一键复制结果或下载到本地。

Unicode 检查与规范化工具适合怎么用

适合在文本进入文档、CMS、表格或提示词前,先清理、对比、整理或提取。

适合文本任务

把日常写作和运营里的重复清理工作省掉。
让文本更容易对比、粘贴、发布或交给下一个工具。
内容还没公开或比较私密时,先在本地处理。

文本检查项

留意多余空格、重复行和被误删的标点。
长文本先试前几行,再处理全文。
先看预览,确认没问题再复制结果。

下一步可以接着做

这些入口会把当前任务接到更完整的工具链里。

真实使用场景

解释两个复制来的用户名为什么不相等
把两个值粘进来，对照逐码点表格。问题可能是分解音符、零宽连接符，或一个看起来像拉丁字母的西里尔字符。规范到 NFC 或 NFKC 后，再复制你希望用户名校验采用的形式。
为搜索索引和去重准备文本
导入 CSV 列之前，把可疑姓名或商品名跑一遍 NFKC 并查看变化。全角字母、带圈数字和连字会折叠成可搜索的等价形式，表格会显示到底是哪几个原始码点造成了错配。
排查损坏 emoji 或畸形导出
如果一个 emoji 被从中间截断，检查器会报告孤立 UTF-16 代理项，而不是把问题藏起来。你仍然可以查看附近字符，再决定修复、丢弃，还是重新导出这一行。

常见踩坑

只保留 NFKC 后的展示文本。外观重要时应保留原文展示，再单独存一个规范化搜索键。
以为一个看得见的字形就是一个码点。emoji 序列、旗帜和带音符字母都可能跨多个码点，切字符串前先看检查表。
把畸形 UTF-16 当成无害。孤立代理项说明数据被截断或解码错误，在成为标识符之前应该修复。

隐私说明

检查与规范化都在浏览器本地运行。短文本可以写进 URL 方便分享示例，但超大粘贴输入会保留在本地，组件不会把文本发送给任何 API。

常见问题

类似工具组合

做你这行的人, 还会一起用这些。

看这个职业的全部工具

Unicode 检查与规范化: 码点、字符名、类别、NFC、NFD、NFKC、NFKD

码点检查表

这个工具能做什么

工具细节

怎么用

1. 输入

2. 处理

3. 复制 / 下载

Unicode 检查与规范化工具 适合怎么用

适合文本任务

文本检查项

下一步可以接着做

真实使用场景

解释两个复制来的用户名为什么不相等

为搜索索引和去重准备文本

排查损坏 emoji 或畸形导出

常见踩坑

隐私说明

常见问题

Unicode 规范化工具

Unicode 字符检查器

Unicode 码点检查器

HTML 实体编码 / 解码

文字转二进制工具

A1Z26 字母数字密码

中医穴位查询

广告文案检查清单

文本加行号

全角美学文字生成器

AI Eval 计划生成器

AI 法律提示词库

Unicode 检查与规范化工具适合怎么用