上一篇 下一篇 分享链接 返回 返回顶部

AI搜索爬虫正在吃掉服务器资源?影响分析与实用配置方案

发布人:慈云数据-客服中心 发布时间:15小时前 阅读量:4

AI搜索 对服务器有什么影响|附配置文件

随着大模型与智能问答技术的普及,越来越多网站开始面对一个新现象:来自 AI 搜索、AI 爬虫、AI 摘要工具、智能问答平台的访问量正在快速增加。

过去,站长主要关注传统搜索引擎爬虫,例如 Googlebot、Bingbot、百度蜘蛛等;而现在,除了传统搜索引擎之外,ChatGPT、Perplexity、Claude、Bytespider、Amazonbot、Applebot、FacebookBot 等各类 AI 相关爬虫也开始频繁访问网站内容,用于索引、摘要、训练、检索增强生成等场景。

这类访问对网站来说既是机会,也是压力。机会在于内容可能被 AI 搜索引用,从而带来新的曝光;压力在于 AI 爬虫访问频率不稳定、并发高、抓取深度大,可能对服务器 CPU、内存、带宽、数据库和日志系统造成明显影响。

本文将系统分析 AI搜索对服务器的影响,并给出可直接使用的配置文件,包括 robots.txt、Nginx 限流配置、Cloudflare 防护思路、Fail2ban 规则以及日志分析命令,帮助站长在“允许合理抓取”和“保护服务器资源”之间取得平衡。


一、什么是 AI 搜索?

AI 搜索并不是简单的传统搜索引擎结果页,而是通过大语言模型、向量检索、网页索引、实时搜索等技术,对用户问题进行理解、检索、总结和回答。

常见的 AI 搜索或 AI 问答产品包括:

  • ChatGPT Search
  • Perplexity
  • Google AI Overviews
  • Microsoft Copilot / Bing Chat
  • Claude
  • Kimi
  • 豆包
  • 夸克AI搜索
  • 秘塔AI搜索
  • 其他基于大模型的智能检索工具

这些产品为了回答用户问题,通常需要访问互联网内容。访问方式大致分为几类:

  1. 传统搜索引擎索引数据

    • AI 产品使用已有搜索引擎数据,例如 Bing、Google 或自有搜索索引。
  2. 实时网页抓取

    • 用户提问后,系统临时访问网页,获取页面内容并生成答案。
  3. 长期爬虫索引

    • AI 平台提前抓取大量网页,建立自己的内容索引。
  4. 训练数据采集

    • 一些爬虫可能用于模型训练或数据集建设。
  5. RAG 检索增强

    • 将网页内容存储为向量数据,用于后续语义检索和答案生成。

从服务器角度看,这些访问本质上都是 HTTP 请求。只不过与普通用户访问不同,AI 爬虫可能短时间内集中访问大量页面,甚至访问一些用户很少访问的历史页面、标签页、搜索页、归档页和动态接口。


二、AI搜索对服务器的主要影响

1. 带宽消耗增加

AI 爬虫抓取页面时,会下载 HTML、部分静态资源,甚至会访问图片、CSS、JS、接口等内容。如果网站页面体积较大,或者图片没有做压缩和 CDN 加速,带宽消耗会明显增加。

例如,一个普通文章页面大小为:

  • HTML:100KB
  • CSS/JS:500KB
  • 图片:2MB
  • 总计约:2.6MB

如果 AI 爬虫一天抓取 10,000 个页面,就可能产生约 26GB 的流量。对于小型云服务器而言,这已经是一笔不小的资源开销。

更严重的是,如果多个 AI 爬虫同时访问,带宽峰值可能会突然升高,导致真实用户访问变慢。


2. CPU 负载升高

动态网站,例如 WordPress、Discuz、Typecho、Drupal、Laravel、ThinkPHP、Django、Spring Boot 等,每次访问页面都可能触发模板渲染、插件执行、数据库查询、缓存读取等操作。

AI 爬虫如果高频访问动态页面,会导致 CPU 使用率上升。

尤其是以下页面更容易消耗 CPU:

  • 站内搜索结果页
  • 标签聚合页
  • 分类分页页
  • 评论分页页
  • 动态筛选页面
  • 用户中心页面
  • API 接口页面
  • 无缓存的文章详情页

如果网站没有启用页面缓存,AI 爬虫可能会让服务器长期处于高负载状态,表现为:

  • 页面打开变慢
  • PHP-FPM 进程占满
  • Node.js 进程 CPU 飙升
  • Java 服务线程阻塞
  • Nginx 等待后端响应时间变长
  • 系统 load average 持续高于 CPU 核心数

3. 数据库压力增加

AI 爬虫通常不会像普通用户一样只访问首页和热门文章,它们可能会根据站点地图、内链、归档页一路深入抓取大量旧内容。

如果每个页面访问都会查询数据库,那么数据库压力会明显增加。

常见表现包括:

  • MySQL 慢查询变多
  • 数据库连接数升高
  • Threads_running 增加
  • 磁盘 I/O 升高
  • 查询缓存命中率下降
  • Redis 或 Memcached 压力增加
  • 数据库 CPU 占用过高

对于内容型网站,如果没有缓存,AI 爬虫可能会让数据库成为瓶颈。


4. 日志文件快速膨胀

大量爬虫访问会导致 Nginx、Apache、应用日志快速增长。

常见日志包括:

  • /var/log/nginx/access.log
  • /var/log/nginx/error.log
  • /var/log/apache2/access.log
  • PHP-FPM 日志
  • 应用程序访问日志
  • WAF 日志
  • CDN 日志

如果没有配置日志切割,磁盘可能被日志占满。一旦系统盘写满,服务器可能出现严重问题,例如:

  • 网站无法写入缓存
  • 数据库无法写入数据
  • 登录 SSH 变慢
  • 服务异常退出
  • 系统无法正常创建临时文件

对于小型服务器来说,AI 爬虫带来的日志膨胀往往比带宽消耗更容易被忽视。


5. 缓存命中率下降

AI 爬虫喜欢访问大量长尾页面,而这些页面平时可能很少被真实用户访问。

如果网站启用了缓存,这些冷门页面会被临时生成并写入缓存,占用缓存空间。结果可能导致热门页面缓存被挤出,从而降低整体缓存命中率。

例如:

  • Redis 内存被大量冷门页面缓存占用
  • CDN 边缘节点缓存被低价值页面污染
  • 本地页面缓存目录文件数量暴增
  • 对象存储或缓存服务成本上升

这类问题可以称为“缓存污染”。它不会立刻导致网站宕机,但会让网站性能逐渐下降。


6. 安全风险增加

并不是所有自称 AI 爬虫的访问都是真实爬虫。一些恶意请求会伪装成知名 AI Bot 的 User-Agent,例如伪装成:

  • GPTBot
  • ChatGPT-User
  • PerplexityBot
  • ClaudeBot
  • Google-Extended
  • Bytespider

恶意访问者可能利用这些 UA 绕过限制,对网站进行扫描、采集、撞库或漏洞探测。

因此,站长不能仅凭 User-Agent 判断对方是否可信,还应该结合:

  • IP 段
  • DNS 反查
  • ASN 信息
  • 请求频率
  • 请求路径
  • 行为特征
  • 是否访问敏感接口

三、AI搜索对不同类型服务器的影响

1. 小型博客服务器

配置可能是:

  • 1核 CPU
  • 1GB 内存
  • 1Mbps~5Mbps 带宽
  • WordPress / Typecho
  • MySQL 与 Web 服务同机

这类服务器最容易受到 AI 爬虫影响。只要几个爬虫同时抓取,就可能导致 CPU 和内存升高,页面响应变慢。

建议:

  • 开启页面静态缓存
  • 限制爬虫访问频率
  • 禁止抓取搜索页、标签页、后台页
  • 使用 CDN
  • 配置日志切割
  • 设置 robots.txt

2. 中型内容站

配置可能是:

  • 4核~8核 CPU
  • 8GB~16GB 内存
  • 独立数据库
  • Redis 缓存
  • CDN 加速

这类网站通常能承受一定爬虫流量,但如果内容量大、页面多、内链复杂,AI 爬虫会消耗不少资源。

建议:

  • 区分搜索引擎爬虫和 AI 爬虫策略
  • 对 AI 爬虫设置 Crawl-delay
  • 对动态接口设置限流
  • 优化站点地图
  • 使用 CDN 缓存 HTML
  • 监控数据库慢查询

3. 大型资讯站或资源站

大型网站更关注成本和内容授权问题。AI 搜索可能带来曝光,但也可能减少用户点击,因为用户在 AI 答案页已经获得摘要。

服务器方面,主要影响是:

  • 爬虫流量成本上升
  • CDN 成本上升
  • 日志和分析系统压力上升
  • 版权内容被摘要使用
  • API 和图片资源被频繁访问

建议:

  • 与 AI 平台建立内容授权策略
  • 对不同 Bot 精细化管理
  • 通过 WAF 验证真实爬虫身份
  • 对非合作 AI 爬虫限制或禁止
  • 对高价值内容设置访问控制

四、应该允许还是屏蔽 AI 爬虫?

这个问题没有统一答案,要根据网站目标决定。

适合允许 AI 爬虫的情况

如果你的网站目标是获取曝光,例如:

  • 技术博客
  • 企业官网
  • 产品文档
  • 开源项目文档
  • 教程网站
  • 品牌内容站

那么适当允许 AI 搜索抓取可能有价值。AI 搜索回答用户问题时,如果引用你的网站,可能会带来品牌曝光和精准流量。

适合限制 AI 爬虫的情况

如果你的网站存在以下情况,则建议限制:

  • 服务器配置较低
  • 内容有版权保护需求
  • 不希望内容被 AI 摘要
  • 数据库压力已经较高
  • 网站主要依赖广告展示
  • AI 搜索带来大量抓取但几乎没有回访流量

折中策略

最推荐的方式不是“一刀切屏蔽”,而是分层管理:

  • 允许传统搜索引擎正常抓取
  • 允许部分可信 AI 搜索适度抓取
  • 禁止访问后台、搜索页、参数页、接口页
  • 对高频爬虫限速
  • 对异常 UA 或伪装爬虫封禁
  • 对图片、附件、API 做额外保护

五、常见 AI 爬虫 User-Agent

以下是一些常见 AI 或相关爬虫标识,实际可能变化,建议定期查看官方文档:

爬虫 常见 User-Agent
OpenAI GPTBotChatGPT-UserOAI-SearchBot
Anthropic ClaudeBotClaude-Web
Perplexity PerplexityBotPerplexity-User
Google Google-ExtendedGooglebot
Microsoft BingbotMSNBot
ByteDance Bytespider
Apple Applebot
Meta FacebookBot
Amazon Amazonbot
Common Crawl CCBot

需要注意的是,User-Agent 可以伪造,所以它只能作为规则的一部分,不能作为唯一判断依据。


六、配置文件一:robots.txt 基础版

如果你希望允许主流搜索引擎抓取,但限制 AI 爬虫访问,可以使用以下配置。

文件路径:

网站根目录/robots.txt

示例:

# robots.txt
# 允许传统搜索引擎正常抓取,限制部分 AI 爬虫

User-agent: *
Disallow: /wp-admin/
Disallow: /admin/
Disallow: /login/
Disallow: /search/
Disallow: /*?s=
Disallow: /*?replytocom=
Disallow: /tag/
Disallow: /author/
Disallow: /api/
Disallow: /user/
Disallow: /cart/
Disallow: /checkout/
Crawl-delay: 5

# OpenAI
User-agent: GPTBot
Disallow: /

User-agent: ChatGPT-User
Disallow: /

User-agent: OAI-SearchBot
Disallow: /

# Anthropic
User-agent: ClaudeBot
Disallow: /

User-agent: Claude-Web
Disallow: /

# Perplexity
User-agent: PerplexityBot
Disallow: /

User-agent: Perplexity-User
Disallow: /

# ByteDance
User-agent: Bytespider
Disallow: /

# Common Crawl
User-agent: CCBot
Disallow: /

# Amazon
User-agent: Amazonbot
Disallow: /

# 站点地图
Sitemap: https://www.example.com/sitemap.xml

这个配置的含义是:

  • 普通爬虫不能访问后台、搜索页、用户页、接口页等;
  • 对指定 AI 爬虫完全禁止;
  • 提供站点地图给允许访问的搜索引擎;
  • Crawl-delay 用于建议爬虫降低频率,但并不是所有爬虫都会遵守。

如果你希望让 AI 搜索收录内容,可以不要全部 Disallow: /,而是只禁止敏感路径。


七、配置文件二:robots.txt 温和版

如果你希望保留 AI 搜索曝光,但不希望它抓取太猛,可以使用温和版。

# robots.txt
# 温和限制 AI 爬虫,仅禁止低价值和高消耗页面

User-agent: *
Disallow: /wp-admin/
Disallow: /admin/
Disallow: /login/
Disallow: /search/
Disallow: /*?s=
Disallow: /*?keyword=
Disallow: /*?filter=
Disallow: /*?sort=
Disallow: /*?page=
Disallow: /api/
Disallow: /user/
Disallow: /cart/
Disallow: /checkout/
Crawl-delay: 3

User-agent: GPTBot
Disallow: /search/
Disallow: /tag/
Disallow: /author/
Disallow: /api/
Crawl-delay: 10

User-agent: ClaudeBot
Disallow: /search/
Disallow: /tag/
Disallow: /author/
Disallow: /api/
Crawl-delay: 10

User-agent: PerplexityBot
Disallow: /search/
Disallow: /tag/
Disallow: /author/
Disallow: /api/
Crawl-delay: 10

User-agent: Bytespider
Disallow: /search/
Disallow: /tag/
Disallow: /author/
Disallow: /api/
Crawl-delay: 10

Sitemap: https://www.example.com/sitemap.xml

温和版适合内容站、博客、文档站。它不是完全拒绝 AI 爬虫,而是要求它们不要访问低价值页面。


八、配置文件三:Nginx 根据 User-Agent 限制 AI 爬虫

robots.txt 只是协议,不具备强制力。真正想控制服务器资源,需要在 Nginx 层做限制。

下面示例会识别常见 AI 爬虫,并对其限流。

1. 在 http 块中添加 map 和限流区域

编辑:

sudo vim /etc/nginx/nginx.conf

http {} 内加入:

# 识别 AI Bot
map $http_user_agent $is_ai_bot {
    default 0;
    ~*GPTBot 1;
    ~*ChatGPT-User 1;
    ~*OAI-SearchBot 1;
    ~*ClaudeBot 1;
    ~*Claude-Web 1;
    ~*PerplexityBot 1;
    ~*Perplexity-User 1;
    ~*Bytespider 1;
    ~*CCBot 1;
    ~*Amazonbot 1;
    ~*Applebot 1;
    ~*FacebookBot 1;
}

# AI Bot 限流区域
limit_req_zone $binary_remote_addr zone=ai_bot_limit:10m rate=1r/s;

# 普通访问限流区域
limit_req_zone $binary_remote_addr zone=normal_limit:10m rate=10r/s;

2. 在站点 server 块中使用

编辑站点配置:

sudo vim /etc/nginx/conf.d/example.com.conf

添加:

server {
    listen 80;
    server_name example.com www.example.com;

    root /www/wwwroot/example.com;
    index index.php index.html index.htm;

    # 对 AI Bot 限流
    if ($is_ai_bot) {
        set $ai_limit 1;
    }

    location / {
        # 普通请求限流
        limit_req zone=normal_limit burst=30 nodelay;

        try_files $uri $uri/ /index.php?$query_string;
    }

    location ~ \.php$ {
        # PHP 动态请求限流
        limit_req zone=normal_limit burst=20 nodelay;

        fastcgi_pass unix:/run/php/php8.2-fpm.sock;
        fastcgi_index index.php;
        include fastcgi_params;
        fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
    }

    # 禁止 AI Bot 访问高消耗路径
    location ~* ^/(search|api|user|admin|wp-admin|login) {
        if ($is_ai_bot) {
            return 403;
        }

        try_files $uri $uri/ /index.php?$query_string;
    }

    # 静态资源缓存
    location ~* \.(jpg|jpeg|png|gif|webp|css|js|ico|svg|woff|woff2)$ {
        expires 30d;
        access_log off;
        add_header Cache-Control "public, max-age=2592000";
    }
}

需要注意:Nginx 中 if 使用不当可能产生问题。上面的写法较简单,如果你的站点配置复杂,建议使用 map + 独立 location 或 WAF 规则实现。

配置完成后测试并重载:

sudo nginx -t
sudo systemctl reload nginx

九、配置文件四:Nginx 直接屏蔽 AI 爬虫

如果你确定不希望 AI 爬虫访问,可以在 Nginx 中直接返回 403。

map $http_user_agent $block_ai_bot {
    default 0;
    ~*GPTBot 1;
    ~*ChatGPT-User 1;
    ~*OAI-SearchBot 1;
    ~*ClaudeBot 1;
    ~*Claude-Web 1;
    ~*PerplexityBot 1;
    ~*Perplexity-User 1;
    ~*Bytespider 1;
    ~*CCBot 1;
    ~*Amazonbot 1;
    ~*Applebot 1;
    ~*FacebookBot 1;
}

server 块中加入:

if ($block_ai_bot) {
    return 403;
}

完整示例:

server {
    listen 80;
    server_name example.com www.example.com;

    root /www/wwwroot/example.com;
    index index.php index.html;

    if ($block_ai_bot) {
        return 403;
    }

    location / {
        try_files $uri $uri/ /index.php?$query_string;
    }
}

这种方式比 robots.txt 更强制,但也可能导致你的内容无法出现在部分 AI 搜索结果中。


十、配置文件五:Nginx 针对爬虫单独记录日志

为了判断 AI 爬虫到底消耗了多少资源,可以单独记录它们的访问日志。

http 块中添加:

map $http_user_agent $ai_bot_log {
    default 0;
    ~*GPTBot 1;
    ~*ChatGPT-User 1;
    ~*OAI-SearchBot 1;
    ~*ClaudeBot 1;
    ~*Claude-Web 1;
    ~*PerplexityBot 1;
    ~*Perplexity-User 1;
    ~*Bytespider 1;
    ~*CCBot 1;
    ~*Amazonbot 1;
}

log_format ai_bot_format '$remote_addr - $time_local "$request" '
                         '$status $body_bytes_sent "$http_referer" '
                         '"$http_user_agent" rt=$request_time';

server 块中添加:

access_log /var/log/nginx/ai_bot_access.log ai_bot_format if=$ai_bot_log;

这样可以单独分析 AI 爬虫访问行为。

查看访问量:

wc -l /var/log/nginx/ai_bot_access.log

查看访问最多的 IP:

awk '{print $1}' /var/log/nginx/ai_bot_access.log | sort | uniq -c | sort -nr | head

查看最常访问的 URL:

awk -F\" '{print $2}' /var/log/nginx/ai_bot_access.log | awk '{print $2}' | sort | uniq -c | sort -nr | head -20

十一、配置文件六:Fail2ban 自动封禁异常爬虫

如果某些爬虫不遵守规则,短时间内高频访问,可以使用 Fail2ban 自动封禁。

1. 新建过滤规则

创建文件:

sudo vim /etc/fail2ban/filter.d/nginx-ai-bot.conf

内容:

[Definition]
failregex = ^ - .* "(GET|POST).*" (200|301|302|403|404|499|500) .* "(GPTBot|ChatGPT-User|OAI-SearchBot|ClaudeBot|PerplexityBot|Bytespider|CCBot|Amazonbot).*"
ignoreregex =

2. 新建 jail 配置

创建文件:

sudo vim /etc/fail2ban/jail.d/nginx-ai-bot.local

内容:

[nginx-ai-bot]
enabled = true
filter = nginx-ai-bot
logpath = /var/log/nginx/access.log
maxretry = 120
findtime = 60
bantime = 3600
action = iptables-multiport[name=nginx-ai-bot, port="http,https"]

含义:

  • 60 秒内访问超过 120 次;
  • 自动封禁 1 小时;
  • 只对匹配 AI Bot UA 的请求生效。

重启 Fail2ban:

sudo systemctl restart fail2ban
sudo fail2ban-client status nginx-ai-bot

十二、配置文件七:logrotate 日志切割

为了避免爬虫导致日志爆炸,建议配置日志切割。

创建文件:

sudo vim /etc/logrotate.d/nginx-ai-bot

内容:

/var/log/nginx/ai_bot_access.log {
    daily
    rotate 14
    compress
    delaycompress
    missingok
    notifempty
    create 0640 www-data adm
    sharedscripts
    postrotate
        [ -s /run/nginx.pid ] && kill -USR1 `cat /run/nginx.pid`
    endscript
}

这表示:

  • 每天切割一次;
  • 保留 14 天;
  • 自动压缩;
  • 空日志不处理。

测试:

sudo logrotate -d /etc/logrotate.d/nginx-ai-bot

十三、WordPress 站点优化建议

如果你使用 WordPress,AI 爬虫带来的压力通常会更明显,因为 WordPress 页面动态渲染较重,插件也可能增加数据库查询。

建议:

1. 开启页面缓存

可选插件:

  • WP Super Cache
  • W3 Total Cache
  • LiteSpeed Cache
  • WP Rocket

如果使用 Nginx,也可以配置 FastCGI Cache。

2. 禁止抓取搜索页

WordPress 搜索页通常会造成数据库压力,建议在 robots.txt 中加入:

Disallow: /?s=
Disallow: /search/

3. 禁止抓取评论参数

Disallow: /*?replytocom=

4. 优化 sitemap

不要把标签页、作者页、低质量归档页加入 sitemap。站点地图应该只包含真正有价值的内容页面。

5. 限制 XML-RPC

如果不使用 XML-RPC,可以在 Nginx 中禁止:

location = /xmlrpc.php {
    return 403;
}

十四、如何判断 AI 爬虫是否影响服务器?

可以从以下几个维度观察。

1. 查看系统负载

top
htop
uptime

如果 load average 长期高于 CPU 核心数,说明服务器压力较大。

2. 查看 Nginx 访问量

awk '{print $1}' /var/log/nginx/access.log | sort | uniq -c | sort -nr | head

3. 查看 AI Bot 请求

grep -Ei "GPTBot|ChatGPT-User|ClaudeBot|PerplexityBot|Bytespider|CCBot" /var/log/nginx/access.log | wc -l

4. 查看响应最慢请求

如果日志中记录了 $request_time,可以执行:

sort -k 10 -nr /var/log/nginx/access.log | head

5. 查看数据库压力

MySQL:

SHOW PROCESSLIST;
SHOW GLOBAL STATUS LIKE 'Threads_running';
SHOW GLOBAL STATUS LIKE 'Slow_queries';

6. 查看磁盘空间

df -h
du -sh /var/log/nginx/*

如果日志目录增长很快,就要配置 logrotate 或单独日志策略。


十五、推荐的综合防护方案

对于大多数站点,推荐如下组合:

  1. robots.txt 控制抓取边界

    • 禁止搜索页、后台页、接口页、参数页;
    • 对 AI 爬虫设置更严格规则。
  2. Nginx 限流

    • 对动态页面限流;
    • 对 AI Bot 单独限流;
    • 对异常请求返回 403 或 429。
  3. 缓存优化

    • 页面缓存;
    • CDN 缓存;
    • 静态资源长期缓存;
    • 避免冷门页面污染核心缓存。
  4. 日志监控

    • 单独记录 AI Bot 访问;
    • 定期分析 IP、UA、URL;
    • 配置日志切割。
  5. 安全识别

    • 不只相信 User-Agent;
    • 对异常 IP 和高频访问封禁;
    • 使用 WAF 或 Fail2ban。
  6. 内容策略

    • 需要曝光的内容可以开放;
    • 高价值内容可以限制;
    • 敏感接口和用户数据必须禁止抓取。

十六、总结

AI搜索正在改变网站流量结构。对站长来说,它既可能带来新的内容曝光,也可能增加服务器成本和运维压力。

从服务器层面看,AI搜索和 AI 爬虫主要会带来以下影响:

  • 增加带宽消耗;
  • 提高 CPU 和内存负载;
  • 增加数据库查询压力;
  • 导致日志快速增长;
  • 降低缓存命中率;
  • 增加伪装爬虫和恶意扫描风险。

因此,网站不应完全忽视 AI 爬虫,也不建议盲目全部放行。更合理的做法是:先观察,再分类,最后精细化控制

如果你希望获得 AI 搜索曝光,可以采用温和版 robots.txt,同时使用 Nginx 限流和缓存优化;如果你更重视内容保护和服务器成本,则可以通过 robots.txt、Nginx、Fail2ban、WAF 等方式限制或屏蔽 AI 爬虫。

总之,AI搜索时代的网站运维核心不再只是“能不能被搜索引擎收录”,而是要回答三个问题:

  1. 哪些内容值得被 AI 抓取?
  2. 哪些爬虫值得信任?
  3. 服务器能承受多大的抓取成本?

只有把内容策略、服务器配置和安全防护结合起来,网站才能在 AI 搜索时代获得收益,同时避免被爬虫流量拖垮。

目录结构
全文