跳到主要内容

字符串字节数统计工具

数一段文本的 UTF-8 字节、UTF-16 码元、Unicode 码点和字符数,全在浏览器本地算

  • 本地处理
  • 分类 开发运维
  • 适合 格式化、校验、压缩或检查和代码相关的文本。
UTF-8 字节
0
TextEncoder · 文件 / 数据库 / 网络大小
UTF-16 码元
0
JavaScript 的 .length
Unicode 码点
0
[...str].length
字符(字素)
0
人眼数出来的个数
UTF-16 字节
0
码元数 × 2
行数
0
按换行符切分

这个工具能做什么

免费的字节数统计工具,告诉你一段文本编码后到底占多少字节。粘进任意 文本,五个数字一次看清:UTF-8 字节数(文件、网络、数据库实际存的就是 它)、UTF-16 码元数(也就是 JavaScript 的 .length,很多语言把它叫 「字符」)、Unicode 码点数(真正的字符,含星光面字符)、字素字符数 (人眼数出来的个数),还有行数。字节数走浏览器自带的 TextEncoder,所以 多字节文本算得准:一个汉字在 UTF-8 里是 3 字节,一个普通 emoji 是 4 字节。给数据库 VARCHAR 列定长度、把文字塞进定长缓冲区、算短信段数、 按网络包上限裁文本,都该用这个工具。全程浏览器本地运算,不上传,输入 会写进网址,分享链接能还原同一段文本。一键复制所有统计。

工具细节

输入
文本
页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
输出
即时结果 + 复制
结果区优先给出可操作结果,支持项会显示复制、下载或可视化预览。
隐私
浏览器本地处理
主工具逻辑未发现外部 API 调用,输入通常留在当前标签页内处理。
保存 / 分享
可分享链接状态
关键设置会进入 URL,复制链接后别人能复现同一组参数。
性能预算
首屏 JS ≤ 9 KB
没有声明 WASM 依赖,适合快速打开和移动端使用。
适用场景
开发运维 · 程序员
分类和职业标签用于推荐相关工具、组织内链,并帮助用户快速判断是否适合当前任务。

怎么用

  1. 1. 输入

    把内容粘贴或拖入工具面板。

  2. 2. 处理

    点击按钮,在浏览器内本地处理,文件不上传。

  3. 3. 复制 / 下载

    一键复制结果或下载到本地。

字符串字节数统计 适合怎么用

适合穿插在写代码、查问题、做 Review、上线前的小任务里。

适合开发场景

  • 格式化、校验、压缩或检查和代码相关的文本。
  • 把片段整理好再放进文档、工单、提交或交接材料。
  • 不切换工具,快速检查一个小 payload。

开发检查项

  • 压缩、混淆这类不可逆处理,先对副本操作。
  • 除非确认工具本地处理,不要粘贴密钥和敏感片段。
  • 转换后的代码上线前,仍要跑自己的测试或 lint。

下一步可以接着做

这些入口会把当前任务接到更完整的工具链里。

  1. 1 JSON 格式化与校验 浏览器内即时格式化、校验、压缩 JSON,数据不离开本地。 打开
  2. 2 正则测试 实时测 JavaScript 正则(匹配高亮 / 捕获组 / 替换预览 / 标志可调),浏览器本地 打开
  3. 3 字数统计 字数 / 字符 / 句子 / 段落 / 阅读时间一次看清,中英日韩混排支持,浏览器本地 打开

真实使用场景

  • 给数据库列定长度,别让它溢出

    要加一个昵称字段,列是按字节限长的 VARCHAR。把几个最极端的带重音 和 CJK 的名字粘进来,看 UTF-8 字节数,挑一个不会在入库时拒掉真实 用户的列宽。

  • 把文字塞进定长的网络或协议缓冲区

    一个二进制协议给字符串字段留了固定字节数。把候选值粘进来,拿 UTF-8 字节总数跟上限比,按字节裁而不是按字符数瞎猜,免得在边界处把一个 多字节序列截断成乱码。

  • 核对短信和消息的长度上限

    短信段和很多聊天 API 是按编码后大小限长,不是按可见字符数。把消息 丢进来,盯着字节数和码点数,提前知道加上一两个 emoji 后会不会超过 阈值、分成第二条计费段。

  • 排查 .length 和后端对不上的问题

    前端说一个字符串长 8,后端却嫌它太大拒掉了。粘到这里,对比 UTF-16 长度、码点数和 UTF-8 字节数;这个差距通常就暴露出一个代理对,或者 一串被按字节计数的后端算成另一个数的多字节字符。

常见踩坑

  • 用 .length 校验长度还当它等于字符数。遇到 emoji 或任何星光面字符,.length 每个字符算 2,于是一个 140 单位的上限会拒掉用户以为远没到 140 字的文本。

  • 按字符数定存储而不是按字节。10 个汉字看着是 10,实际占 30 个 UTF-8 字节,所以一个能放 16 个英文字母的 16 字节缓冲区,放到第 3 个汉字就溢出。

  • 把一个 emoji 当成一个码点。很多 emoji 是用零宽连接符或修饰符拼起来的序列,屏幕上一个图形,实际可能是好几个码点、十几个甚至更多字节。

隐私说明

每一项统计都是浏览器标签页里运行的纯 JavaScript,用内置 TextEncoder 算, 文本不上传、不记录。唯一要注意:输入会编码进页面网址,分享链接能还原同一 段文本,也就是说你粘到聊天里的链接,会把文本带在查询字符串里,留进对方 服务器的访问日志。涉及敏感内容,请复制统计结果,而不是分享网址。

常见问题

类似工具组合

做你这行的人, 还会一起用这些。

Made by Toolora · 100% client-side · Updated 2026-06-14