跳到主要内容

Unicode 码位探查 — UTF-8、UTF-16、类别与脚本

输入任意字符或 U+XXXX 码位,立即查看 UTF-8 字节序列、UTF-16 编码、Unicode 类别、文字脚本与所属区块

  • 本地处理
  • 分类 编码加密
  • 适合 快速检查小 payload、令牌、哈希和编码值。

在上方输入或粘贴文本,即可逐字查看字符信息。

这个工具能做什么

免费在线 Unicode 码位探查工具。粘贴任意文本或输入 U+1F600 这样的码位, 立即显示:Unicode 码位(U+XXXX)、官方字符名称、Unicode 通用类别(Lu、Ll、 Nd…)、文字脚本(拉丁文、汉字、阿拉伯文…)、Unicode 区块、UTF-8 字节序列、 UTF-16 编码(含代理对)、HTML 实体、JavaScript 转义(\u 或 \u{...})和 CSS 转义。全面覆盖 Emoji、CJK 统一汉字、阿拉伯文、天城文及全部 110 万个 Unicode 码位。100% 浏览器本地运行,不上传任何内容。

工具细节

输入
文本 + 数值
页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
输出
即时结果 + 复制
结果区优先给出可操作结果,支持项会显示复制、下载或可视化预览。
隐私
浏览器本地处理
主工具逻辑未发现外部 API 调用,输入通常留在当前标签页内处理。
保存 / 分享
可分享链接状态
关键设置会进入 URL,复制链接后别人能复现同一组参数。
性能预算
首屏 JS ≤ 28 KB
没有声明 WASM 依赖,适合快速打开和移动端使用。
适用场景
编码加密 · 程序员
分类和职业标签用于推荐相关工具、组织内链,并帮助用户快速判断是否适合当前任务。

怎么用

  1. 1. 输入

    把内容粘贴或拖入工具面板。

  2. 2. 处理

    点击按钮,在浏览器内本地处理,文件不上传。

  3. 3. 复制 / 下载

    一键复制结果或下载到本地。

Unicode 字符码位查询工具 适合怎么用

适合做浏览器本地的编码、解码、哈希、令牌检查和可分享转换。

适合编码任务

  • 快速检查小 payload、令牌、哈希和编码值。
  • 把值整理好再放进 API、URL、文档或客服工单。
  • 输入可能敏感时,尽量避开账号型在线工具。

编码检查项

  • 真实密钥不要随便粘贴,除非确认能接受本地浏览器处理。
  • 分享结果前确认这个操作是否可逆。
  • 哈希值要核对算法和大小写是否符合对方要求。

下一步可以接着做

这些入口会把当前任务接到更完整的工具链里。

  1. 1 URL 编码 / 解码 把空格、中文、emoji 等特殊字符转 %xx 百分号编码,或反向解码,全程浏览器本地 打开
  2. 2 HTML 实体转换 HTML 实体编码 / 解码:& < > " ' 与所有数字引用,纯浏览器本地 打开
  3. 3 Base64 编码 / 解码 文本、文件、Data URL 一站搞定,纯浏览器运行,数据不离开本地。 打开

真实使用场景

  • 排查导致 JSON 或 SQL 查询崩溃的特殊字符

    弯引号(U+2019,RIGHT SINGLE QUOTATION MARK,UTF-8:E2 80 99)看起来和 ASCII 撇号完全相同,却会让 SQL 字符串字面量和 JSON 解析器报错。把可疑 字符粘贴进来,确认码位,再替换成正确的 ASCII 字符,或用 HTML 实体 &#x2019; 实现 HTML 安全渲染。

  • 理解移动 App 开发中的 Emoji 编码

    😀(U+1F600)这类 Emoji 位于 Unicode 补充平面,需要 4 字节 UTF-8 序列 (F0 9F 98 80)和 UTF-16 代理对(D83D DE00)。iOS Swift、Android Kotlin 和 JavaScript 各有不同的处理方式。把任何 Emoji 输入进来,就能看到在目标 平台上所需的精确字节序列和代理对数值。

  • 验证中日韩字符的编码方式

    汉字、日文、韩文(U+4E00–U+9FFF 及扩展区)在 UTF-8 中每个字符占 3 字节。 如果数据库字段用 latin1 而非 utf8mb4 存储,每个汉字都会乱码。把可疑字符 粘进来,查看精确的 UTF-8 编码,确认表的字符集应该用哪种 collation。

常见踩坑

  • 混淆"Unicode 码位"和"UTF-8 字节值"。U+00E9(é)是一个码位,但编码为两个 UTF-8 字节(0xC3 0xA9)。码位数值和字节序列要分开确认。

  • 以为 JavaScript 字符串里每个字符都是一个码位。JS 字符串是 UTF-16,补充平面字符(U+10000 以上)的 .length 是 2(代理对)。需要用 for...of 或 Array.from 按真实码位遍历。

  • 在 JavaScript 里用 \uXXXX 转义补充平面字符。\uXXXX 只能处理 U+0000–U+FFFF。Emoji 和其他高码位字符要用 \u{1F600}(ES6 模板)或显式代理对写法。

隐私说明

所有分析均在浏览器本地完成,使用内置的 TextEncoder API 和 JavaScript 的 Unicode 属性转义。你粘贴的文本或输入的码位不会发送到任何服务器,也不会被存储。URL 状态会把输入编码进查询字符串以便分享,如果输入包含敏感标识符,请勿分享链接。

常见问题

类似工具组合

做你这行的人, 还会一起用这些。

Made by Toolora · 100% client-side · Updated 2026-07-01