Question 1

我粘的 HTML 会被上传吗?

Accepted Answer

不会。解析全部由浏览器原生 `DOMParser` 完成, 你粘的 HTML、抽出来的表格、生成的 CSV/JSON, 一个字节都不会发到服务器。URL 分享链接只带输出选项 (分隔符、引号策略、表头模式), 不带 HTML 本身 -- 因为整页源码里常混着邮箱地址、带 session 的 URL、cookie 弹窗这些不适合放进分享链接的东西。

Question 2

colspan 和 rowspan 真的处理对了吗?

Accepted Answer

对的, 这正是这个工具最难的部分。算法是先建一个二维网格, 每个单元格按 `colspan × rowspan` 的矩形把值盖进去, 同时把这些格子标记为"已占用", 下一行的单元格遍历时会跳过已占用的位置。这是唯一正确的做法;直接"往行数组里 push"的写法在上一行有 rowspan 时会让下面行的列错位一格, 这种 bug 一般要把表格肉眼对一遍才能看出来。
试一下"Wikipedia 人口表"那个例子 -- 日本跨 2 行, 大阪那一行依然落在"城市"列, 不会掉到"国家"列里去。

Question 3

嵌套表格 (一个 `` 套在 `

` 里) 怎么办?

Accepted Answer

每张嵌套表都会作为独立条目放进结果列表, 父单元格留一个 `[table #N]` 标记指向它的位置。
没选"全部扁平化" (会丢结构) 也没选"序列化进父单元格" (会让 CSV 无法再次解析) 这两种坏方案 -- 这也是 Excel 从网页粘贴表格时的做法。
输出区上方的标签条可以切换不同表格, 点 "下载 ×N" 会把所有表格拼成一个文件下载。

Question 4

表头检测怎么判断哪一行是表头?

Accepted Answer

三种模式: - **自动** -- 源里有 `` 就用它的行 (多行 `` 也支持, 键名按 " / " 拼接);没有 `` 就看第一行, 全是非空非数字内容才当表头。像 `1, 2, 3` 或者 `12.5%, 8.0%` 这种数字行不会被误判成表头。 - **首行为表头** -- 强制把第一行当表头, 不管内容长什么样。 - **无表头** -- 每一行都是数据, JSON 输出这时变成二维数组。

Question 5

为什么 Excel 打开 CSV 后中文变乱码?

Accepted Answer

这是 BOM 问题。Excel 的 CSV 导入器默认按本地代码页 (中文 Windows 是 GB-18030) 读, 除非文件开头有 UTF-8 字节序标记 (BOM)。把上面的 "BOM (Excel UTF-8 用)" 勾上, 工具会在文件最前面写 `0xEF 0xBB 0xBF` 这三字节, Excel 看到就会按 UTF-8 解。中文字段和数字不会变, 只是把"打开能正常显示"这步做对。

Question 6

能粘一整页保存下来的 HTML 吗, 不只是表格片段?

Accepted Answer

能。底层用的是 `DOMParser('text/html')` 宽容模式, 跟浏览器加载真页面是同一个解析器。然后 `querySelectorAll('table')` 把所有 `` 找出来, 不管外面套了多少层 html/body/div。script、style、页眉、页脚都会被忽略。整段 `......` 粘进来, 只把里面的表格抽出来给你。

Question 7

CSV / TSV / JSON 三种输出有啥区别?

Accepted Answer

- **CSV** 是最通用的电子表格格式, Excel、Google Sheets、pandas `read_csv` 都认。字段里有逗号或换行的时候自动加引号 (工具帮你处理了)。
- **TSV** 用制表符分隔, 字段里有逗号也不用加引号。Excel 复制单元格时输出的就是 TSV, 反过来粘 TSV 进 Excel 或 Google Sheets 也是一个 tab 一格。
- **JSON** 是给代码用的。有表头时出 `{列名: 值}` 的对象数组, 无表头时出二维数组。JavaScript 直接 `JSON.parse`, Python 用 `json.loads`, jq 也能处理。

Question 8

合并表头 (两行 th, 上面一行带 colspan) 这种能处理吗?

Accepted Answer

能。试一下 GitHub 数据表那个例子, 第一行 `` 带 `rowspan="2"` 和 `colspan="2"`。工具会把两行 `` 都识别成表头, JSON 输出的键名变成 `上周 / Star`、`上周 / Fork` 这样拼起来的形式。万一两个列拼出来键名一样, 第二个、第三个会自动加 `_2`、`_3` 后缀, 保证 JSON 还能合法解析。

HTML 表格转 CSV / TSV / JSON / Markdown

这个工具能做什么

工具细节

怎么用

1. 输入

2. 处理

3. 复制 / 下载

HTML 表格转 CSV/TSV/JSON 工具适合怎么用

适合转换的任务

转换检查项

下一步可以接着做

真实使用场景

5 秒把维基百科对比表拽进电子表格

把 GitHub Insights 表格抽出来写周报

政府开放数据没有 "下载 CSV" 链接的时候

把论坛排行榜表格转成 Markdown 放进 wiki

对比两个版本的供应商规格表

一次性导出嵌套报销表里的 20 张子表

常见踩坑

隐私说明

常见问题

类似工具组合

HTML 表格转 CSV / TSV / JSON / Markdown

这个工具能做什么

工具细节

怎么用

1. 输入

2. 处理

3. 复制 / 下载

HTML 表格转 CSV/TSV/JSON 工具 适合怎么用

适合转换的任务

转换检查项

下一步可以接着做

真实使用场景

5 秒把维基百科对比表拽进电子表格

把 GitHub Insights 表格抽出来写周报

政府开放数据没有 "下载 CSV" 链接的时候

把论坛排行榜表格转成 Markdown 放进 wiki

对比两个版本的供应商规格表

一次性导出嵌套报销表里的 20 张子表

常见踩坑

隐私说明

常见问题

JSON 转 TypeScript Interface

CSV ⇄ JSON 互转

JSON 格式化与校验

Markdown 表格生成

XML ⇄ JSON 互转工具

角度换算器

Base64 编码 / 解码

Base64 转文件

BBCode 转 HTML

中文数字转换器

汉字转拼音

生肖查询(中国十二生肖)

HTML 表格转 CSV/TSV/JSON 工具适合怎么用