大数跨境
0
0

robots.txt 的几种常见设置方式 以及 如何修改

robots.txt 的几种常见设置方式 以及 如何修改 行者WP独立站搭建&SEO
2025-09-22
29
导读:1. 什么是 robots.txt?

1. 什么是 robots.txt?

robots.txt 是位于网站根目录下的一个文本文件,用于告知搜索引擎爬虫(crawler/robot)哪些页面或目录可以抓取,哪些需禁止访问。

例如:

  • 允许所有搜索引擎抓取:

       

    User-agent: *
    Allow: /

  • 禁止所有搜索引擎抓取:

       

    User-agent: *
    Disallow: /

2. 常见的 robots.txt 设置方式

✅ 2.1 允许所有内容被抓取

适用于电商、博客等以内容展示为主的网站。

 

User-agent: *
Allow: /

✅ 2.2 禁止整个网站抓取

适用于开发中或测试环境,防止被搜索引擎收录。

 

User-agent: *
Disallow: /

✅ 2.3 屏蔽指定目录

可用于隐藏后台管理、登录页等敏感路径。

 

User-agent: *
Disallow: /admin/
Disallow: /login/
Disallow: /cart/

✅ 2.4 针对特定搜索引擎设置

可针对特定爬虫(如 Googlebot)限制访问某些目录。

 

User-agent: Googlebot
Disallow: /private/

✅ 2.5 添加 sitemap 提示

在 robots.txt 中声明站点地图地址,便于搜索引擎发现和抓取。

 

User-agent: *
Allow: /
Sitemap: https://www.example.com/sitemap.xml

3. 如何修改 robots.txt

🔧 3.1 WordPress 网站

  • 方法一:安装 Yoast SEO 或 Rank Math 插件,通过后台直接编辑 robots.txt;
  • 方法二:使用 FTP 或主机控制面板进入网站根目录(如 /public_html/),查找并手动修改 robots.txt 文件。

🔧 3.2 Shopify / Wix / Squarespace

  • 系统通常自动生成 robots.txt,用户无法直接编辑,但可通过内置 SEO 工具或主题设置进行有限调整。

🔧 3.3 自建独立站 (PHP/HTML)

  • 在网站根目录(如 /var/www/html/)创建或修改 robots.txt 文件;
  • 保存后上传至服务器即可生效。

4. 修改 robots.txt 的注意事项

  1. 避免屏蔽关键页面:产品页、分类页等核心内容必须允许抓取;
  2. 不要误禁 CSS/JS 资源:否则可能影响搜索引擎对页面的渲染与索引;
  3. 使用调试工具验证:可通过 Google Search Console 的“抓取 robots.txt”功能测试配置是否正确;
  4. 及时更新并提交 sitemap:修改 robots.txt 后建议同步提交最新站点地图,加快搜索引擎重新抓取。
【声明】内容源于网络
0
0
行者WP独立站搭建&SEO
各类跨境出海行业相关资讯
内容 117
粉丝 0
行者WP独立站搭建&SEO 各类跨境出海行业相关资讯
总阅读3.8k
粉丝0
内容117