阻擋 AI 訓練之後還能被 ChatGPT 引用嗎?
可以。擋 GPTBot 只阻止內容被納入訓練,但 ChatGPT Search 用 OAI-SearchBot 即時抓取仍可引用。ClaudeBot vs Claude Search、Google-Extended vs Googlebot 同理。
這是 GEO 領域最常被誤解的設定。AI 廠商刻意把訓練與搜尋拆成兩個 user-agent,就是為了讓網站擁有「我不想被當訓練資料、但我想被 AI 引用」的中間選項。
OpenAI 官方文件明確說明:擋 GPTBot 僅影響「未來訓練資料集」,不影響 ChatGPT Search、ChatGPT 內 Browsing 工具的即時抓取。要完整阻擋 ChatGPT 全面接觸,需同時擋 `GPTBot` + `OAI-SearchBot` + `ChatGPT-User`。Anthropic、Google、Perplexity 採類似分層架構。
戰略建議:多數品牌應「擋訓練、開搜尋」——避免內容被免費當訓練語料,但保留即時 AI 引用機會。內容已存在於 Common Crawl 等公開資料集的網站擋訓練爬蟲意義不大,反而開放讓 AI 持續抓最新內容更有利。
重點
- 擋 GPTBot 不影響 ChatGPT Search 即時抓取
- 完整阻擋 ChatGPT 需擋 GPTBot + OAI-SearchBot + ChatGPT-User
- 推薦策略:擋訓練、開搜尋
相關內容
- [faq] 怎麼阻擋 AI 訓練? — 阻擋 AI 訓練只需在 robots.txt 對 GPTBot、ClaudeBot、Google-Extended、PerplexityBot 加 Disall
- [faq] 怎麼讓 ChatGPT 推薦? — 讓 ChatGPT 推薦品牌需開放 GPTBot 與 OAI-SearchBot 爬蟲、撰寫答案優先內容、補完 E-E-A-T 信號、建立第三方提及與 llms
- [glossary] AI 爬蟲完整列表 — AI 爬蟲是 OpenAI、Anthropic、Perplexity 等公司部署、抓取網頁內容供 LLM 訓練與即時搜尋使用的自動化機器人。
- [blog] 閱讀完整指南:三平台引用邏輯(ChatGPT/Perplexity/Gemini) — 三大 AI 搜尋引擎的引用邏輯有何差異?本文深度比較 ChatGPT、Perplexity、Gemini 三平台的爬蟲機制、引用偏好、答案生成邏輯,提供每個平台