在浏览器本地查看码点、字符名、类别、UTF-8 字节,并把文本转换成 NFC、NFD、NFKC 或 NFKD。
- 本地处理
- 分类 文本
- 适合 把日常写作和运营里的重复清理工作省掉。
粘贴文本后即可检查码点,并比较 NFC、NFD、NFKC、NFKD 规范化结果。
标准合成:Unicode 有单一码点时,把基字符和组合标记合成起来。
码点检查表
0 码点
还没有可显示的码点。
这个工具能做什么
一个面向开发者、编辑和本地化团队的纯浏览器 Unicode 检查与规范化工具。 粘贴文本后,可以逐码点查看 U+ 编号、十进制值、尽可能精确的字符名、通用 类别、Unicode 区块、UTF-8 字节、UTF-16 码元、JavaScript 转义和 HTML 实体。同一段输入会同时转换成 NFC、NFD、NFKC 和 NFKD,方便你比较组合音 符、分解后的附加标记、全角字符、连字以及其他兼容字符,并复制真正需要的 那个结果。
工具会把畸形 UTF-16 里的孤立代理项标出来,而不是让页面崩掉;超大粘贴文 本不会写进分享 URL;逐字符表格也会限制展示行数以保持响应速度。整个过程 不请求外部 API,适合排查不可见字符、搜索与去重错配、CSV 导入文本、PDF 复制噪声、用户名、slug 和多语言内容流水线里的编码问题。
工具细节
- 输入
- 文本
- 页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
- 输出
- 即时结果 + 复制
- 结果区优先给出可操作结果,支持项会显示复制、下载或可视化预览。
- 隐私
- 浏览器本地处理
- 主工具逻辑未发现外部 API 调用,输入通常留在当前标签页内处理。
- 保存 / 分享
- 可分享链接状态
- 关键设置会进入 URL,复制链接后别人能复现同一组参数。
- 性能预算
- 首屏 JS ≤ 24 KB
- 没有声明 WASM 依赖,适合快速打开和移动端使用。
- 适用场景
- 文本 · 程序员
- 分类和职业标签用于推荐相关工具、组织内链,并帮助用户快速判断是否适合当前任务。
怎么用
-
1. 输入
把内容粘贴或拖入工具面板。
-
2. 处理
点击按钮,在浏览器内本地处理,文件不上传。
-
3. 复制 / 下载
一键复制结果或下载到本地。
Unicode 检查与规范化工具 适合怎么用
适合在文本进入文档、CMS、表格或提示词前,先清理、对比、整理或提取。
适合文本任务
- 把日常写作和运营里的重复清理工作省掉。
- 让文本更容易对比、粘贴、发布或交给下一个工具。
- 内容还没公开或比较私密时,先在本地处理。
文本检查项
- 留意多余空格、重复行和被误删的标点。
- 长文本先试前几行,再处理全文。
- 先看预览,确认没问题再复制结果。
下一步可以接着做
这些入口会把当前任务接到更完整的工具链里。
真实使用场景
解释两个复制来的用户名为什么不相等
把两个值粘进来,对照逐码点表格。问题可能是分解音符、零宽连接符, 或一个看起来像拉丁字母的西里尔字符。规范到 NFC 或 NFKC 后,再复制 你希望用户名校验采用的形式。
为搜索索引和去重准备文本
导入 CSV 列之前,把可疑姓名或商品名跑一遍 NFKC 并查看变化。全角字 母、带圈数字和连字会折叠成可搜索的等价形式,表格会显示到底是哪几个 原始码点造成了错配。
排查损坏 emoji 或畸形导出
如果一个 emoji 被从中间截断,检查器会报告孤立 UTF-16 代理项,而不是 把问题藏起来。你仍然可以查看附近字符,再决定修复、丢弃,还是重新导出 这一行。
常见踩坑
只保留 NFKC 后的展示文本。外观重要时应保留原文展示,再单独存一个规范化搜索键。
以为一个看得见的字形就是一个码点。emoji 序列、旗帜和带音符字母都可能跨多个码点,切字符串前先看检查表。
把畸形 UTF-16 当成无害。孤立代理项说明数据被截断或解码错误,在成为标识符之前应该修复。
隐私说明
检查与规范化都在浏览器本地运行。短文本可以写进 URL 方便分享示例,但超大 粘贴输入会保留在本地,组件不会把文本发送给任何 API。
常见问题
类似工具组合
做你这行的人, 还会一起用这些。