数一段文本的 UTF-8 字节、UTF-16 码元、Unicode 码点和字符数,全在浏览器本地算
- 本地处理
- 分类 开发运维
- 适合 格式化、校验、压缩或检查和代码相关的文本。
这个工具能做什么
免费的字节数统计工具,告诉你一段文本编码后到底占多少字节。粘进任意 文本,五个数字一次看清:UTF-8 字节数(文件、网络、数据库实际存的就是 它)、UTF-16 码元数(也就是 JavaScript 的 .length,很多语言把它叫 「字符」)、Unicode 码点数(真正的字符,含星光面字符)、字素字符数 (人眼数出来的个数),还有行数。字节数走浏览器自带的 TextEncoder,所以 多字节文本算得准:一个汉字在 UTF-8 里是 3 字节,一个普通 emoji 是 4 字节。给数据库 VARCHAR 列定长度、把文字塞进定长缓冲区、算短信段数、 按网络包上限裁文本,都该用这个工具。全程浏览器本地运算,不上传,输入 会写进网址,分享链接能还原同一段文本。一键复制所有统计。
工具细节
- 输入
- 文本
- 页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
- 输出
- 即时结果 + 复制
- 结果区优先给出可操作结果,支持项会显示复制、下载或可视化预览。
- 隐私
- 浏览器本地处理
- 主工具逻辑未发现外部 API 调用,输入通常留在当前标签页内处理。
- 保存 / 分享
- 可分享链接状态
- 关键设置会进入 URL,复制链接后别人能复现同一组参数。
- 性能预算
- 首屏 JS ≤ 9 KB
- 没有声明 WASM 依赖,适合快速打开和移动端使用。
- 适用场景
- 开发运维 · 程序员
- 分类和职业标签用于推荐相关工具、组织内链,并帮助用户快速判断是否适合当前任务。
怎么用
-
1. 输入
把内容粘贴或拖入工具面板。
-
2. 处理
点击按钮,在浏览器内本地处理,文件不上传。
-
3. 复制 / 下载
一键复制结果或下载到本地。
字符串字节数统计 适合怎么用
适合穿插在写代码、查问题、做 Review、上线前的小任务里。
适合开发场景
- 格式化、校验、压缩或检查和代码相关的文本。
- 把片段整理好再放进文档、工单、提交或交接材料。
- 不切换工具,快速检查一个小 payload。
开发检查项
- 压缩、混淆这类不可逆处理,先对副本操作。
- 除非确认工具本地处理,不要粘贴密钥和敏感片段。
- 转换后的代码上线前,仍要跑自己的测试或 lint。
下一步可以接着做
这些入口会把当前任务接到更完整的工具链里。
真实使用场景
给数据库列定长度,别让它溢出
要加一个昵称字段,列是按字节限长的 VARCHAR。把几个最极端的带重音 和 CJK 的名字粘进来,看 UTF-8 字节数,挑一个不会在入库时拒掉真实 用户的列宽。
把文字塞进定长的网络或协议缓冲区
一个二进制协议给字符串字段留了固定字节数。把候选值粘进来,拿 UTF-8 字节总数跟上限比,按字节裁而不是按字符数瞎猜,免得在边界处把一个 多字节序列截断成乱码。
核对短信和消息的长度上限
短信段和很多聊天 API 是按编码后大小限长,不是按可见字符数。把消息 丢进来,盯着字节数和码点数,提前知道加上一两个 emoji 后会不会超过 阈值、分成第二条计费段。
排查 .length 和后端对不上的问题
前端说一个字符串长 8,后端却嫌它太大拒掉了。粘到这里,对比 UTF-16 长度、码点数和 UTF-8 字节数;这个差距通常就暴露出一个代理对,或者 一串被按字节计数的后端算成另一个数的多字节字符。
常见踩坑
用 .length 校验长度还当它等于字符数。遇到 emoji 或任何星光面字符,.length 每个字符算 2,于是一个 140 单位的上限会拒掉用户以为远没到 140 字的文本。
按字符数定存储而不是按字节。10 个汉字看着是 10,实际占 30 个 UTF-8 字节,所以一个能放 16 个英文字母的 16 字节缓冲区,放到第 3 个汉字就溢出。
把一个 emoji 当成一个码点。很多 emoji 是用零宽连接符或修饰符拼起来的序列,屏幕上一个图形,实际可能是好几个码点、十几个甚至更多字节。
隐私说明
每一项统计都是浏览器标签页里运行的纯 JavaScript,用内置 TextEncoder 算, 文本不上传、不记录。唯一要注意:输入会编码进页面网址,分享链接能还原同一 段文本,也就是说你粘到聊天里的链接,会把文本带在查询字符串里,留进对方 服务器的访问日志。涉及敏感内容,请复制统计结果,而不是分享网址。
常见问题
类似工具组合
做你这行的人, 还会一起用这些。