跳到主要内容

robots.txt 生成器:一键屏蔽 AI 爬虫,放行 Google

生成 robots.txt,内置 Google / Bing / AI 爬虫常见模板。

  • 本地处理
  • 分类 生成器
  • 适合 从空白开始,先拿到一版可修改的结果。
第 1 组
User-agent
快速添加:
Allow 路径
Disallow 路径
Crawl-delay(秒,可选)
User-agent: *
Disallow: 

Sitemap: https://example.com/sitemap.xml

这个工具能做什么

一个可视化的 robots.txt 生成器,专为认真对待"谁能爬我"的站点设计。 可以叠加任意数量的 User-agent 分组,每组独立配置 Allow / Disallow 规则和可选的 Crawl-delay,最下方追加一行或多行 Sitemap URL,输出面板 每次按键实时重建文件内容。内置 4 个生产级模板:"全部允许"(营销站 的默认安全配置)、"全部禁止"(网站施工期)、"屏蔽 AI 爬虫"(精选 通配名单,覆盖 GPTBot、ClaudeBot、Claude-Web、CCBot、PerplexityBot、 Google-Extended、anthropic-ai、FacebookBot、applebot-extended、 Meta-ExternalAgent、Bytespider 这 11 个真实 GSC 日志里训练数据爬虫 ~95% 流量来源)、"WordPress 优化版"(屏蔽 /wp-admin/、/wp-includes/、 常见搜索和筛选 URL,同时放行 admin-ajax.php 保证插件正常工作)。 一键复制给你可直接粘贴的文件文本,下载按钮则导出标准 robots.txt 文件。 100% 浏览器本地运行,不上传、不注册、写的规则不会被记录。

工具细节

输入
文本 + 数值
页面会根据工具类型展示文本框、数值控件、文件选择或结构化输入。
输出
即时结果 + 复制 + 下载
结果区优先给出可操作结果,支持项会显示复制、下载或可视化预览。
隐私
浏览器本地处理
主工具逻辑未发现外部 API 调用,输入通常留在当前标签页内处理。
保存 / 分享
免账号使用
打开页面即可使用;刷新后是否保留结果取决于具体工具。
性能预算
首屏 JS ≤ 18 KB
没有声明 WASM 依赖,适合快速打开和移动端使用。
适用场景
生成器 · 程序员
分类和职业标签用于推荐相关工具、组织内链,并帮助用户快速判断是否适合当前任务。

怎么用

  1. 1. 输入

    把内容粘贴或拖入工具面板。

  2. 2. 处理

    点击按钮,在浏览器内本地处理,文件不上传。

  3. 3. 复制 / 下载

    一键复制结果或下载到本地。

robots.txt 生成器 适合怎么用

适合快速生成初稿、起步素材或结构化结果,再人工整理后发布。

适合生成任务

  • 从空白开始,先拿到一版可修改的结果。
  • 生成可重复使用的草稿、名称、模板或占位素材。
  • 先探索多个选项,再挑最适合当前任务的。

生成检查项

  • 生成内容发给客户、上页面或进文档前,必须人工看过。
  • 有品牌语气、格式或受众要求时,不要沿用默认值。
  • 只保留真正符合任务的部分。

下一步可以接着做

这些入口会把当前任务接到更完整的工具链里。

  1. 1 XML 格式化与校验 浏览器内美化、压缩、校验 XML,保留 CDATA、注释、命名空间。 打开
  2. 2 URL Slug 生成 任意标题转成干净的 URL slug,小写、横线、ASCII 安全转写、可批量,纯浏览器本地 打开
  3. 3 Markdown 转 HTML Markdown 转干净 HTML(标题/列表/代码/链接/图片/表格),实时双栏预览,浏览器本地 打开

真实使用场景

  • 给刚上线的内容站挡住训练爬虫

    你刚发了 200 篇菜谱博客,翻访问日志发现 GPTBot 和 CCBot 吃掉了 40% 带宽。选「屏蔽 AI 爬虫」模板,Googlebot 和 Bingbot 保持「全部 允许」,导出文件传到站根。一天内守规矩的爬虫就退场,源站负载下来 了,搜索引擎照常收录。

  • 把测试站或施工期站点整个封掉

    客户演示挂在 staging.acme.com,你一点都不想让它进 Google 索引。 用「全部禁止」模板,它会写 User-agent: * 加 Disallow: /,复制到 测试站根目录,两下点击就搞定。正式上线时切回「全部允许」重新上传, 不用手改任何路径。

  • 给 WordPress 站调优又不弄坏插件

    你的 WooCommerce 商城在 /wp-admin/ 和几十个 ?orderby= 筛选 URL 上 浪费爬虫预算。「WordPress 优化版」模板屏蔽这些路径,同时放行 admin-ajax.php,购物车和结算的 AJAX 照常工作。底部补一行 Sitemap, 一份干净文件 30 秒搞定,不用磨 20 分钟。

  • 在被屏蔽目录里单独放行一个文件

    你屏蔽了 /downloads/ 不让爬,但想让 /downloads/pricing-2026.pdf 这份公开白皮书保持可收录。在同一组里先写 Disallow: /downloads/, 再写 Allow: /downloads/pricing-2026.pdf。实时预览会按 Googlebot 的 「最长匹配优先」规则展示,上传前你能先核对清楚。

常见踩坑

  • 不小心在全局组写了 Disallow: /,把整站从索引里抹掉。上传前务必重读一遍 User-agent: * 那一组,再在 Search Console 里测几个线上 URL。

  • 以为 Disallow 能让页面从搜索里消失。被屏蔽的 URL 只要有外链,照样可能裸排名(没摘要);真想下架的页面要用 noindex meta 标签。

  • 漏掉 Sitemap 那一行,导致 DuckDuckGo 这类小爬虫永远发现不了。它只占文件底部一行,而且每个 SEO 审计工具都会看。

隐私说明

所有处理都在你的浏览器里完成。你填的 User-agent 分组、Allow/Disallow 规则和 Sitemap URL 不会上传、不被记录、不发往任何服务器,工具也不需要 注册。如果你开启 URL 分享配置,这些规则会成为链接的一部分,所以不想出 现在分享链接里的内部域名就别贴进去。

常见问题

类似工具组合

做你这行的人, 还会一起用这些。

Made by Toolora · 100% client-side · Updated 2026-06-13