我的網站被 AI 抓取了嗎?怎麼知道?

檢查 AI 是否抓取你的網站有三條路:看 server access log 過濾 AI bot user-agent、用 Cloudflare Bot Analytics、或直接到 ChatGPT/Perplexity 實測引用。

最直接的證據在 server access log。透過 Nginx/Apache log 過濾 user-agent 字串,可看到每支 AI 爬蟲的訪問頻率與抓取頁面。常見 user-agent:`GPTBot`(OpenAI 訓練)、`OAI-SearchBot`(ChatGPT 搜尋)、`ClaudeBot`(Anthropic)、`PerplexityBot`(Perplexity 訓練)、`Perplexity-User`(Perplexity 即時搜尋)、`Google-Extended`(Gemini 訓練)。

若用 Cloudflare,可在 Dashboard → Analytics → Bot Analytics 直接看各 AI 爬蟲訪問次數曲線,無需額外設定。WordPress 站可用 Wordfence、Cloudways 等外掛報表。

間接驗證:用 ChatGPT 問「給我 site:你的網域 的內容摘要」、Perplexity 問「請引用 你的網域 的相關資訊」。若 AI 能回傳具體內容=已被抓取且納入索引;若 AI 回「找不到」=可能 robots.txt 擋住、可能 SPA 渲染失敗、可能內容權重太低。

重點

相關內容